写个偷全国公交数据库的程序
作者:互联网
2009-07-01
以前常听到别人做采集程序,今天俺也小试身手。。
using System;
using System.Collections;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Web;
using System.Web.SessionState;
using System.Web.UI;
using System.Net;
using System.Text;
using System.Text.RegularExpressions;
using System.IO;
using System.Data.SqlClient;
using System.Web.UI.WebControls;
using System.Web.UI.HtmlControls;
namespace Temp
{
///
/// GetHtmlSourceFromUrl 的摘要说明。
///
public class GetHtmlSourceFromUrl : System.Web.UI.Page
{
private SqlConnection con;
private void Page_Load(object sender, System.EventArgs e)
{
// 在此处放置用户代码以初始化页面
if(!IsPostBack)
{
InsertToDB();
}
}
private void InsertToDB()
{
for(int i=1;i<1000;i++)
{
string Html = string.Empty;
string SqlText="insert into BeiJingBus(BusLineNumber,Html) Values(@BLN,@Html)";
string ID=xxxx;Pwd=xxxxx;DataBase=Map";
con =new SqlConnection(ConnectionString);
SqlCommand cmd = new SqlCommand(SqlText,con);
string "; // ^_^,这是取北京的 转到首页,换换参数,就可以取其它城市的了
string Content = string.Empty;
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(Url);
HttpWebResponse response =(HttpWebResponse) request.GetResponse();
StreamReader stream = new StreamReader(response.GetResponseStream(),Encoding.GetEncoding("gb2312"));
Content =stream.ReadToEnd();
stream.Close();
response.Close();
int start=3487; //去广告 取正文
int end= Content.Length-4222;//去广告 取正文
if(end-start>0) //判断存在第i路公交
{
Html=Regex.Replace(Content.Substring(start,end-start),@"<[^>]+>",""); //分离html代码
try
{
cmd.Parameters.Add("@BLN",SqlDbType.Int).Value =i;
cmd.Parameters.Add("@Html",SqlDbType.Text).Value= Html;
con.Open();
cmd.ExecuteNonQuery();
}
catch(SqlException err)
{
Response.Write(err.Message);
con.Close();
break;
}
con.Close();
}
}
}
--表sql脚本:
CREATE TABLE [dbo].[BeiJingBus](
[id] [int] IDENTITY(1,1) NOT NULL,
[BusLineNumber] [int] NULL,
[Html] [nvarchar](max) COLLATE Chinese_PRC_CI_AS NULL
) ON [PRIMARY]
不会用签名:陈立/blog
相关标签:
相关推荐
专题
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
最新数据
相关文章
详解.NET Core如何构建一个弹性的HTTP请求机制
.NET Core使用Redis实现创建分布式锁
.NET内存管理释放的两种方式
基于.NET8实现WinFrom应用窗口自动缩放功能
浅析如何在 ASP.NET Core中实现速率限制
.NET Core 委托原理解析(最新推荐)
.NET 9 new features-Microsoft.ML.Tokenizers 库(文本标记化功能)
如何在 .NET 中使用 Tesseract 识别图片文字
ASP.NET Core Web API之Token验证的实现
asp.net core web api项目添加自定义中间件的实现
AI精选
