175

分享到

Tornado异步模式

模式 Tornado 2023-01-31 00:01:50 175人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

先介绍下背景：由于工作需要，前段时间又写了一段爬虫去获取和更新一些数据。之前爬虫主要用scrapy框架批量爬取一些页面数据，或者用Gevent调用目标站点的接口。偶然看到了Tornado，听说这个框架很强大，所以打算这次爬虫用Tornad

先介绍下背景：由于工作需要，前段时间又写了一段爬虫去获取和更新一些数据。之前爬虫主要用scrapy框架批量爬取一些页面数据，或者用Gevent调用目标站点的接口。偶然看到了Tornado，听说这个框架很强大，所以打算这次爬虫用Tornado试试。不足之处，欢迎指正。

总的来说，Tornado是python里面一个轻量的异步非阻塞的框架，性能非常不错，最新版本的异步协程是基于Python内置的asyncio来实现(老版本用装饰器实现异步)。Tornado可以用来做WEB服务，或者利用其异步功能，完成一些异步执行的操作，比如爬虫(PySpider就是基于Tornado实现)。

本次任务，涉及到调用百度自然语言理解(NLU)平台UNIT的一些接口，实现一些自动化和批量操作，比如词槽导入导出，开始机器学习训练，批量测试语句等等。没有拿到百度UNIT平台的接口文档，所以只能通过爬虫形式，模拟用户登录，然后进行各种操作。为了让本篇看起来更简洁，本次不打算详细介绍如何爬取百度UNIT平台，统一调用Httpbin(http://www.httpbin.org/get)进行简化。百度UNIT平台的爬虫后续再补充。

说了那么多，重点来了。Tornado两种异步模式：

1，add_callback(基于asyncio，资源消耗少，性能还不错)

2，run_in_executor((基于线程池/进程池，性能很好，但是资源消耗要高于add_callback的方案)

add_callback方案：

from tornado.ioloop import IOLoop, PeriodicCallback
import requests

# 业务逻辑操作写在这里
def job():
    url    = 'http://www.httpbin.org/get'
    resp   = requests.get(url)
    print(resp.text)


async def runner():
    loop   = IOLoop.current()
    #任务派发写在这里
    for i in range(10):
        loop.add_callback(job)

    print('This will be executed before loop is finished')


if __name__ == '__main__':
    IOLoop.current().run_sync(runner)

run_in_executor方案：

from tornado.ioloop import IOLoop, PeriodicCallback
import requests
from concurrent.futures import ThreadPoolExecutor

# 业务逻辑写在这里
def job():
    url    = 'http://www.httpbin.org/get'
    resp   = requests.get(url)
    print(resp.text)


async def runner():
    loop   = IOLoop.current()

    # 也可以用进程池ProcessPoolExecutor
    exectutor  = ThreadPoolExecutor(20)
    # 任务派发写在这里
    for i in range(10):
        loop.run_in_executor(exectutor, job)

    print('This will be executed before loop is finished')


if __name__ == '__main__':
    IOLoop.current().run_sync(runner)

您可能感兴趣的文档:

--结束END--

本文标题: Tornado异步模式

本文链接: https://lsjlt.com/news/182590.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

Tornado异步模式

Tornado异步模式

Python的Tornado框架的异步任务与AsyncHTTPClient

ASP.NETMVC使用异步TPL模式

C#异步编程的三种模式

ASP.NET基于事件的异步模式与异步Action怎么实现

python异步回调模式怎么实现

Node.js 事件循环中的异步编程模式与反模式

C#中的异步编程模式是什么

Python设计模式中单例模式的实现及在Tornado中的应用

Java 设计模式之责任链模式及异步责任链详解

JavaScript中实现异步编程模式的方法

tornado执行asyncio异步报错run_forever assert self._self_reading_future is None如何解决

【异步】Java 的 8 种异步实现方式

.NET异步编程模式的三种类型介绍

C#实现基于任务的异步编程模式

.NET4.0版本中基于任务的异步模式(TAP)

Java设计模式之代理模式与@Async异步注解失效的解决

Python的Tornado框架实现异步非阻塞访问数据库的示例

python模块之 aiomysql 异步mysql

C++ 函数异常与设计模式：模式化异常处理

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义