如何在C#中网抓、爬虫?

C#中提供了很多网抓、爬虫需要的类。

 

这里我们选用 System.Net.Http 来实现网抓、爬虫。

 

代码如下:

 

using System;
using System.Net.Http;

namespace ConsoleApp1
{
class Program
{

static void Main(string[] args)
{
//定义一个新的网抓类
HttpClient hc = new HttpClient();

//要抓取的网址

string surl = “http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/”;

//返回的字节数组

byte[] arr = hc.GetByteArrayAsync(surl).Result;

//用指定的编码解码
string re = System.Text.Encoding.GetEncoding(“gb2312”).GetString(arr);

//输出结果

Console.WriteLine(re);

Console.ReadKey();

}

}

}

       

发表评论