imageai是一套开源免费的,可以用于图像智能识别的python应用包,使用门槛不高,基本上按照官方文档去写就可以简单实现利用已经训练好的模型识别图像中的物体。
imageai图像预检目前实现了四种模型的算法支持,分别是SqueezeNet,ResNet,InceptionV3 和 DenseNet。不同的包对应的训练模型大小不一致,精度也不一致。
- SqueezeNet(文件大小:4.82 MB,预测时间最短,精准度适中)
- ResNet50 by Microsoft Research (文件大小:98 MB,预测时间较快,精准度高)
- InceptionV3 by Google Brain team (文件大小:91.6 MB,预测时间慢,精度更高)
- DenseNet121 by Facebook AI Research (文件大小:31.6 MB,预测时间较慢,精度最高)
imageai不仅可以用于图像识别,还可以进行图形对象检测,视频对象预测和跟踪,自定义训练模型等。对于机器学习不够深入的人员非常友好,可以几行代码实现一个AI应用。
更多深入的内容可以查看原文
下面,简单了解一下如何在Python本地服务中搭建一个图像识别应用。
安装imageAI的依赖
imageAI的依赖
python(>=3.5.1)
Tensorflow(>=1.4.0)
Numpy(>=1.13.1)
SciPy(>=0.19.1)
OpenCV
pillow
matplotlib
h5py
keras
若安装好了pip3 可以直接运行 pip3 install tensorflow numpy scipy opencv-python pillow matplotlib h5py keras imageai
imageAI的训练模型
imageAI支持使用在ImageNet-1000数据集上训练的4种不同的机器学习算法,也支持在CoCo数据集集上训练的对象检测。
图像预检
需要下载一个训练模型。
这里就直接使用facebookAI的训练模型DenseNet121。
废话不多说,上代码:
from imageai.Prediction import ImagePrediction
import os,JSON
execution_path = os.getcwd() # 当前命令行执行路径
prediction = ImagePrediction() # 获取这个图像预测实例
prediction.setModelTypeAsDenseNet() # facebook AI,此处要根据下一步加载的模型文件来确立对应的model类型,其他还有setModelTypeAsSqueezeNet(普通) setModelTypeAsResNet(微软模型) setModelTypeAsInceptionV3(谷歌模型),训练识别精确度依次提升,facebook最准确
prediction.setModelPath(os.path.join(execution_path, "DenseNet-BC-121-32.h5")) # 加载模型文件,就是刚刚下载好的那个
prediction.loadModel(prediction_speed="fast") # 速度调节,如果配置这个则需要使用精确度较高的模型,否则会出现识别率下降的问题
predictions, probabilities =prediction.predictImage(os.path.join(execution_path, "test.jpg"), result_count=6) # 对应的图像识别路径,以及相应的返回结果数量
predictionDict = {}
for eachPrediction, eachProbability in zip(predictions, probabilities):
predictionDict[eachPrediction] = eachProbability
res = json.dumps(predictionDict)
print(res) # 输出结果
虽然这里设置了"fast",但其实对于单核来说运行速度仍然比较慢,如果你的运行服务器是多核的,可以试试并行计算,把多个核都用起来,效率会有不少提升。
代码对应行都有相应注释,看一下打印结果:
{"loudspeaker": 33.06401073932648, "modem": 26.803183555603027, "hard_disc": 7.0777274668216705, "projector": 4.804840311408043, "lighter": 2.9418328776955605, "electric_fan": 1.8662691116333008}
返回的是key-value的json格式,key代表物品名,value代表可能性性百分比数值,最高100,最低0,分别表示准确识别和不可能,由于训练模型使用的是FacebookAI类型的,所以标签名也是英文的,这对于中文用户来说可能需要一个转译的过程。
如何使用python进行中英文翻译,这里不赘述,pip安装googletrans试试看,不过需要翻墙。
好了,基本的识别逻辑有了,我们可以搭建一个Http服务,使用get请求来接收一个图片文件名,然后让Python帮我们识别上传的图片里都有什么内容。
上代码:
from http.server import httpserver,BaseHTTPRequestHandler
import io,shutil,urllib
from imageai.Prediction import ImagePrediction
import os,json
class MyHttpHandler(BaseHTTPRequestHandler):
def do_GET(self):
name=""
if '?' in self.path:
self.queryString=urllib.parse.unquote(self.path.split('?',1)[1])
#name=str(bytes(params['name'][0],'GBK'),'utf-8')
params=urllib.parse.parse_qs(self.queryString)
name=params["name"][0] if "name" in params else None
r_str=name
enc="UTF-8"
encoded = ''.join(r_str).encode(enc)
if name:
execution_path = os.getcwd()
if execution_path == '' or execution_path == '/':
execution_path = '/www-root/blog' # 因为网关模式执行Python可能导致当前执行路径为'/'或者空的情况。
prediction = ImagePrediction()
prediction.setModelTypeAsDenseNet() # facebook AI
prediction.setModelPath(os.path.join(execution_path, "DenseNet-BC-121-32.h5"))
prediction.loadModel(prediction_speed="fast")
predictions, probabilities = prediction.predictImage(os.path.join(execution_path, "image/"+name), result_count=3)
predictionDict = {}
for eachPrediction, eachProbability in zip(predictions, probabilities):
predictionDict[eachPrediction] = eachProbability
res = json.dumps(predictionDict)
encoded = ''.join(res).encode(enc)
f = io.BytesIO()
f.write(encoded)
f.seek(0)
self.send_response(200)
self.send_header("Content-type", "text/html; charset=%s" % enc)
self.send_header("Content-Length", str(len(encoded)))
self.end_headers()
shutil.copyfileobj(f,self.wfile)
httpd=HTTPServer(('',8080),MyHttpHandler)
print("Server started on 127.0.0.1,port 8080.....")
httpd.serve_forever()
在服务器运行python3 你的脚本名.py
就可以完美运行啦!
curl -X GET 'http://127.0.0.1:8080?name=IMG_8590.JPG'
# response
{"loudspeaker": 33.06401073932648, "modem": 26.803183555603027, "hard_disc": 7.0777274668216705, "projector": 4.804840311408043, "lighter": 2.9418328776955605, "electric_fan": 1.8662691116333008}
结尾
本文只介绍了图像识别以及如何加在python http server中方便内部调用,其实还可以做得更多,比如图形对象检测,视频对象跟踪等,你也可以自定义训练模型,按照对应的4种算法处理模型数据,搞一个自定义AI产品。
0