WEB开发网
开发学院WEB开发Jsp JSP抓取网页代码的程序 阅读

JSP抓取网页代码的程序

 2001-11-24 16:39:33 来源:WEB开发网   
核心提示:<%@ page contentType="text/html;charset=gb2312"%><%String sCurrentLine;String sTotalString;sCurrentLine="";sTotalString=""
<%@ page contentType="text/html;charset=gb2312"%>
<% 

String sCurrentLine; 

String sTotalString; 

sCurrentLine=""; 

sTotalString=""; 

java.io.InputStream l_urlStream; 

java.net.URL l_url = new java.net.URL("http://www.163.net/"); 

java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection(); 

l_connection.connect(); 

l_urlStream = l_connection.getInputStream(); 

java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream)); 

while ((sCurrentLine = l_reader.readLine()) != null) 

{ 

sTotalString+=sCurrentLine; 

} 

out.PRintln(sTotalString); 

%>

后记 

  虽然代码比较简单,但是,我认为根据这个,可以实现“网络爬虫”的功能,比如从页面找href连接,然后再得到那个连接,然后再“抓”,不停止地(当然可以限定层数),这样,可以实现“网页搜索”功能。 

Tags:JSP 抓取 网页

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接