C#中提供了很多网抓、爬虫需要的类。
这里我们选用 System.Net.Http 来实现网抓、爬虫。
代码如下:
using System;
using System.Net.Http;namespace ConsoleApp1
{
class Program
{static void Main(string[] args)
{
//定义一个新的网抓类
HttpClient hc = new HttpClient();//要抓取的网址
string surl = “http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/”;
//返回的字节数组
byte[] arr = hc.GetByteArrayAsync(surl).Result;
//用指定的编码解码
string re = System.Text.Encoding.GetEncoding(“gb2312”).GetString(arr);//输出结果
Console.WriteLine(re);
Console.ReadKey();
}
}
}
发表评论