返回顶部
首页 > 资讯 > 前端开发 > node.js >Nodejs抓取html页面内容(推荐)
  • 298
分享到

Nodejs抓取html页面内容(推荐)

页面内容Nodejs 2022-06-04 17:06:53 298人浏览 独家记忆
摘要

废话不多说,直接给大家贴node.js抓取html页面内容的核心代码了。 具体代码如下所示: var Http = require("http"); var iconv = require('iconv

废话不多说,直接给大家贴node.js抓取html页面内容的核心代码了。

具体代码如下所示:


var Http = require("http");
var iconv = require('iconv-lite');
var option = { 
hostname: "stockdata.stock.hexun.com",
path: "/gszl/s601398.shtml"
}; 
var req = http.request(option, function(res) {
res.on("data", function(chunk) {
console.log(iconv.decode(chunk, "gbk"));
}); 
}).on("error", function(e) {
console.log(e.message);
});
req.end();

下面再看下面一种nodejs抓取网页内容


function loadPage(url) {
var http = require('http');
var pm = new Promise(function (resolve, reject) {
http.get(url, function (res) {
var html = '';
res.on('data', function (d) {
html += d.toString()
});
res.on('end', function () {
resolve(html);
});
}).on('error', function (e) {
reject(e)
});
});
return pm;
}
loadPage('http://www.baidu.com').then(function (d) {
console.log(d);
}); 

--结束END--

本文标题: Nodejs抓取html页面内容(推荐)

本文链接: https://lsjlt.com/news/12977.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Nodejs抓取html页面内容(推荐)
    废话不多说,直接给大家贴node.js抓取html页面内容的核心代码了。 具体代码如下所示: var http = require("http"); var iconv = require('iconv...
    99+
    2022-06-04
    页面 内容 Nodejs
  • Python抓取网页内容
    import urllib.request response=urllib.request.urlopen("http://www.baidu.co...
    99+
    2023-01-31
    网页 内容 Python
  • Python中怎么抓取网页内容
    Python中怎么抓取网页内容,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。Python抓取网页内容方法一、用urllib2/sgmllib包,将目标网页的所有...
    99+
    2023-06-17
  • 使用nodejs怎么抓取页面的始末
    使用nodejs怎么抓取页面的始末,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。事由以及动机2015年9月份全国研究生数学建模...
    99+
    2024-04-02
  • jquery怎么调用获取html页面内容
    这篇“jquery怎么调用获取html页面内容”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇...
    99+
    2024-04-02
  • 有哪些让网站页面内容不被抓取的技巧
    本篇内容主要讲解“有哪些让网站页面内容不被抓取的技巧”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“有哪些让网站页面内容不被抓取的技巧”吧!  可能有的朋友会奇怪,网站的页面不是让搜索引擎抓的越多...
    99+
    2023-06-10
  • node.js抓取并分析网页内容有无特殊内容的js文件
    nodejs获取网页内容绑定data事件,获取到的数据会分几次相应,如果想全局内容匹配,需要等待请求结束,在end结束事件里把累积起来的全局数据进行操作! 举个例子,比如要在页面中找有没有www.baid...
    99+
    2022-06-04
    内容 有无 网页
  • Python实现周期性抓取网页内容的方法
    本文实例讲述了Python实现周期性抓取网页内容的方法。分享给大家供大家参考,具体如下: 1.使用sched模块可以周期性地执行指定函数 2.在周期性执行指定函数中抓取指定网页,并解析出想要的网页内容,代码...
    99+
    2022-06-04
    周期性 网页 方法
  • python抓取网页内容并保存的方法是什么
    在Python中,可以使用requests库来抓取网页内容,并使用文件操作来保存抓取到的内容。下面是一个示例代码: import r...
    99+
    2024-03-04
    python
  • Python使用lxml模块和Requests模块抓取HTML页面的教程
    Web抓取 Web站点使用HTML描述,这意味着每个web页面是一个结构化的文档。有时从中 获取数据同时保持它的结构是有用的。web站点不总是以容易处理的格式, 如 csv 或者 json 提供它们的数据。...
    99+
    2022-06-04
    模块 页面 教程
  • Python使用urllib2模块抓取HTML页面资源的实例分享
    先把要抓取的网络地址列在单独的list文件中 http://www.lsjlt.com/article/83440.html http://www.lsjlt.com/article/83437.ht...
    99+
    2022-06-04
    实例 模块 页面
  • python抓取并保存html页面时乱码问题的解决方法
    本文实例讲述了python抓取并保存html页面时乱码问题的解决方法。分享给大家供大家参考,具体如下: 在用Python抓取html页面并保存的时候,经常出现抓取下来的网页内容是乱码的问题。出现该问题的原因...
    99+
    2022-06-04
    乱码 解决方法 并保存
  • 将 html 页面内容(缓冲区)保存到 .log 文件
    最近发现不少小伙伴都对Golang很感兴趣,所以今天继续给大家介绍Golang相关的知识,本文《将 html 页面内容(缓冲区)保存到 .log 文件》主要内容涉及到等等知识点,希望能帮到你!当然如...
    99+
    2024-04-05
  • 如何通过nodejs服务器读取HTML文件渲染到页面
    这篇文章主要介绍了如何通过nodejs服务器读取HTML文件渲染到页面,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。1.分别简单实现三个备用...
    99+
    2024-04-02
  • Node.js中怎么利用jade抓取博客内容并生成静态html文件
    这篇文章将为大家详细讲解有关Node.js中怎么利用jade抓取博客内容并生成静态html文件,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。项目结构:好了,...
    99+
    2024-04-02
  • c# 从IE浏览器获取当前页面的内容
    private void timer1_Tick(object sender, EventArgs e) { lock (currentL...
    99+
    2024-04-02
  • 小程序如何获取其他页面的文本内容
    在微信小程序中使用getCurrentPages()方法获取其他页面的文本内容 var pages = getCurrentPages();var Page = pages[pages.length - 1]; //当前页var prevP...
    99+
    2024-04-02
  • HTML 段落标签:内容组织的基石,打造引人入胜的页面
    清晰的层次结构 标签将内容划分为清晰的段落,可增强文本的可读性并使读者轻松浏览。清晰的层次结构便于用户浏览页面并理解内容之间的关系。 视觉吸引力 段落标签创建视觉上的间距,使页面外观更加美观。通过控制段落之间的空白,可以增强页面的整体吸...
    99+
    2024-04-02
  • phpcms V9 专题的内容页面生成的html目录太深附最新的修改方法
    找到文件: \phpcms\modules\special\functions\global.func.php function content_url 此函数,大概位置23行---56行,找到如下代码:function...
    99+
    2022-06-12
    html目录
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作