返回顶部
首页 > 资讯 > 后端开发 > Python >语音识别实战(python代码)(一)
  • 448
分享到

语音识别实战(python代码)(一)

语音识别人工智能深度学习python开发语言 2023-08-31 13:08:37 448人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

语音识别实战   (python :pyttsx、Sapi、SpeechLib实例代码)(一) 本文目录: 一、语音识别的基本原理 (1)、语音识别的起源与发展 (2)、语音识别的基本原理 (3)、语音识别过程 (4)、语音识别的近期发展

语音识别实战

 

python :pyttsx、Sapi、SpeechLib实例代码)(一)

本文目录:

一、语音识别的基本原理

(1)、语音识别的起源与发展

(2)、语音识别的基本原理

(3)、语音识别过程

(4)、语音识别的近期发展

二、Python 语音识别

(1)、文本转换为语音

(2)、文本转存为语音文件wav

三、总结


一、语音识别的基本原理

(1)、语音识别的起源与发展

  语音识别是一门涉及声学、语言学、信号处理、模式识别、心理学,以及计算机科学等多个学科领域的复杂交叉技术学科。

  语音识别技术的发展:

07dc34a8eb9b43af8230fa7d355d4225.jpeg

(2)、语音识别的基本原理

  对普通人来说,我们通常感觉语音是由一个个单词构成,但它是如何产生和被我们感知的?

  其实,语音是一种连续动态的音频流,由一部分相当稳定的状态与诸多动态变化的状态混合而成。在这种状态序列中,人们可以定义或多或少类似的声音或音素。

035b1884f94a4db5ad165ba9186dbc86.png

  语音是随时间变化的语音动态波形。

  一个典型的语音对话系统一般包括如下几个技术模块:

  • 对话管理器(Dialog Manager)
  • 语音识别器(Speech Recognizer)
  • 语言解析器(Language Parser)
  • 语言生成器(Language Generator)
  • 语音合成器(Speech Synthesizer)

4f4ff063788e4cb8a6e46ea61bd1dbc0.png

  其中,语音识别器(又可称为语言识别模块或者语言识别系统)主要用于将用户输入的语音转换为文本。

 (3)、语音识别过程

  语音识别的一般方法是:

  首先,声音输入,提取一个波形,然后,将波形分解为语音片段并尝试识别每个语音片段中所包含的内容。

  通常情况下,要做到这一点,我们需要尝试将所有可能的单词组合与音频进行匹配,最后选择最佳匹配组合,这时就要依赖声音模型、语音模型、各种发音词典。在这个匹配过程中,由于参数的数量很大,需要对其进行优化。一般来说,会将语音分成小单位的帧,然后,对于每帧(通常为时长10ms左右),提取出39个代表语音特征的数字,这些数字即语音特征向量。

  语音识别过程示意图:

60a8a8516dbb45078bc5e50c5e5d3acf.png

  语音识别是一个先编码后解码的过程。其中,信号处理(Signal Processing)与特征提取(Feature Extraction)是语音识别系统的开始,这是一个编码的过程。

  特征提取是指从原始的语音输入经过相应处理后得到语音特征向量。

  语言模型:当若干词组成的一个序列合乎语法时,这个序列才能算是一个句子,因此,人们在语音识别中引入了语言模型来实现这种约束。

  当前的语言模型主要有基于句法的语言模型和基于统计的语言模型两大类。

  句法语言模型(Syntactic Language Model),也称确定性语言模型(Deterministic Language Model)或形式语言模型(FORMal Language Model),是人工对人类语言的内在规律总结出一套形式上可以推理和扩展的文法,对识别结果中不符合文法的结果进行排除。这种方法在某些识别任务中能够获得很好的效果。

  基于统计的语言模型对大量文本中的词的出现频率及其出现条件进行统计。通常我们将统计语言模型与声学模型结合起来完成识别任务,这可以降低因为声学模型的不合理带来的拒识率。 目前在大词汇量连续语音识别中常用的是 N-Gram 语言模型[23],对中文而言,我们称之为汉语语言模型(CLM,Chinese Language Model)。

    一个语言模型的质量的评价指标通常用语言模型复杂度(Perplexity)来表述,其定义为词序列概率的几何平均的倒数。公式:

25b9f1e5ef324cb585775f3ea12c72c3.jpeg

   当复杂度越低,说明语言模型对当前词的预测确定程度越高。因此对语言模型的训练一般把训练语句的复杂度最小化作为目标。而实现这个目标,先要对训练语句中的词频进行统计,以此计算出语言模型的参数。而在词表很大而训练的数据不是充分多的时候,就会发生有些词的序列的概率很小或者没有出现过的情况(oov)。为了解决这些问题,就需要用到 discouting和 back-off等一些技术。

  一个语言模型的质量的评价指标通常用语言模型复杂度(Perplexity)来表述,其定义为词序列概率的几何平均的倒数。

(4)、语音识别的近期发展

  据:中国语音产业联盟《中国智能语音产业发展报告(2021-2022)》统计数据:

  从全球范围来看,2022年全球智能语音产业规模将达351.2亿美元,保持33.1%的高速增长;从我国来看,根据德勤统计数据,2022年我国智能语音市场将达341亿元,同比增长13.4%。

  科大讯飞、百度、阿里等龙头企业通过打造技术能力开放平台,构建开源生态,引领行业技术创新和应用开发

  报告指出,我国智能语音企业在多项难点技术上实现新的突破。纵向上从语音识别、合成、翻译向计算机视觉、认知智能、运动智能领域延伸,横向上从单点技术突破模式发展到机器认知、多模式复杂场景应用。

  在语音合成方面,随着电商直播等行业的繁荣,语音合成技术也表现出拟人化、口语化的发展趋势。

  在语音识别方面,视听融合的多模态交互技术成为技术演进的主要方向。

  在工业领域,我国打造了包括国家智能语音创新中心在内的一批语音技术创新“国家队”, 开展工业声学、多语种、ai语音芯片等关键共性技术研究工作。

  在城市领域,智能语音技术已在安徽省一体化网上政务服务平台、聊城城市大脑、三亚市崖州湾科技城智慧产城园区、天津市AI银发智能服务平台等创新示范项目中应用。

  在医疗领域,智能外呼和智医助理可用于独居老人、留守儿童的日常关爱和兜底保障。

  在教育领域,利用智能语音和人工智能技术可实现英语听说教、学、考、评、管一站式服务,减少无效训练。

  在运营商领域,智能语音技术与健康养老、家庭教育、家庭娱乐等场景结合,带来更加智慧的家庭生活体验。融合5G与机器翻译技术的无障碍智能通信,让普通的5G手机用户,不用下载任何软件,就可以使用实时翻译和转写服务,实现跨语种的无障碍视频通话。

  在汽车领域,智能语音已成人机交互关键环节,并从车内交互衍生车外交互,从单模交互走向多模交互,从被动交互发展为主动交互,为车企提供全栈技术赋能。

  在消费者产品领域,AI学习机、翻译笔等AI+学习产品帮助学生学习减负增效;智能录音笔、智能办公本、智能鼠标等AI+办公产品深受职场人士欢迎;AI翻译机、智能麦克风、智能语音键盘、智能耳机、智能助听器等AI+生活产品,让更多人享受AI科技的便利。

  语音的发展路径:

  针对智能语音多学科交叉的学科特性,研究人员需要探索新原理、新机制、新材料、新工艺和新器件,集成创新推动核心技术进步。另一方面,语音技术需要进一步向深度理解延伸。“更先进的语音交互系统不仅要 "能听会说" ,还要深度地去理解人的信息。有了明确的发展方向,才能促进智能语音技术持续突破。

二、Python 语音识别

(1)、文本转换为语音

(a)、使用 pyttsx

安装 pyttsx 包

  • import pyttsx3 as pyttsx
import pyttsx3 as pyttsxengine = pyttsx.init()engine.say('I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。')engine.runAndWait()

  如果你安装没有出错,打开电脑的声音,就能听到语音(把我们刚才在代码里写的文本文字转换成语音播报出来了)

代码分析:

pyttsx3通过初始化来获取语音引擎,在调用init后会返回一个engine对象。

import pyttsx3

#初始化语音引擎
engine = pyttsx3.init()

设置语速、音量等参数:

engine.setProperty('rate', 100)   #设置语速
engine.setProperty('volume',0.6)  #设置音量

查看语速、音量等参数

rate = engine.getProperty('rate')
print(f'语速:{rate}')
volume = engine.getProperty('volume')   
print (f'音量:{volume}') 

 完整实例代码:

import pyttsx3 as pyttsxengine = pyttsx.init()engine.say('I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。')rate = engine.getProperty('rate')print(f'语速:{rate}')volume = engine.getProperty('volume')   print (f'音量:{volume}') engine.runAndWait()

运行结果为:

查看语音合成器
voices = engine.getProperty('voices') 
for voice in voices:
    print(voice) 

合成器的主要参数如下:

合成器的主要参数如下:
age发音人的年龄默认为None
gender字符串为类型的发音人性别

male, female, or neutral.

默认为None

id关于Voice的字符串确认信息
languages发音支持的语言列表默认为一个空的列表
name发音人名称默认为None
语音合成器

默认的有两个

两个语音合成器均可以合成英文音频,

只有第一个合成器能合成中文音频。

如果需要其他的语音合成器需要自行下载和设置。

#设置第一个语音合成器
voices = engine.getProperty('voices') 
engine.setProperty('voice',voices[0].id)   

语音播报:

engine.say('I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。')
engine.runAndWait()
engine.stop()

import pyttsx3engine = pyttsx3.init() #初始化语音引擎engine.say('I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。')rate = engine.getProperty('rate')print(f'语速:{rate}')volume = engine.getProperty('volume')   print (f'音量:{volume}') engine.setProperty('rate', 100)   #设置语速engine.setProperty('volume',0.6)  #设置音量voices = engine.getProperty('voices') engine.setProperty('voice',voices[0].id)   #设置第一个语音合成器engine.runAndWait()engine.stop()

运行结果为:

  如果你没有出错,打开电脑的声音,就能听到语音(把我们刚才在代码里写的文本文字转换成语音播报出来了:I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。)

  我们设置使用第一个语音合成器,同时,屏幕会打印出当前语速是200,音量是:1.0

(b)、使用 SAPI

  也可以使用 SAPI 来做文本到语音的转换。

   SAPI是微软Speech API , 是微软公司推出的语音接口。

from win32com.client import Dispatch# 获取讲话对象speaker = Dispatch('SAPI.SpVoice')# 讲话内容speaker.Speak('Just Be You')speaker.Speak('No one can do it just like you')speaker.Speak('Something magic in the way you move')speaker.Speak('You are original, you know it is true')speaker.Speak('do not let anybody take your tune')speaker.Speak('You are not Got a single thing to prove')speaker.Speak('You are original, so just be you')speaker.Speak('Just be you')speaker.Speak('You are one of a kind')speaker.Speak('The kind of once in a lifetime')speaker.Speak('Not just another face in the crowd')speaker.Speak('You light up a room')speaker.Speak('With the light that is inside you')speaker.Speak('do not be afraid to let it out')speaker.Speak('So hold your head up')speaker.Speak('do not let anybody get you down')speaker.Speak('No one can do it just like you')speaker.Speak('Something magic in the way you move')speaker.Speak('You are original, you know it is true')speaker.Speak('do not let anybody take your tune')speaker.Speak('You are not got a single thing to prove')speaker.Speak('You are original, so just be you')speaker.Speak('Just be you')speaker.Speak('Ooh, just be you')speaker.Speak('Ooh, just be you')speaker.Speak('You gotta believe')speaker.Speak('You are here for a reason')speaker.Speak('This world needs somebody like you')speaker.Speak('Cause anybody can be a copy')speaker.Speak('And there will always be people talking')speaker.Speak('So face your fears and chase your dreams')speaker.Speak('And dance like no one is watching')speaker.Speak('No one can do it just like you')speaker.Speak('Something magic in the way you move')speaker.Speak('You are original, you know it is true')speaker.Speak('do not let anybody take your tune')speaker.Speak('You are not got a single thing to prove')speaker.Speak('You are original, so just be you')speaker.Speak('Just be you')speaker.Speak('Ooh, just be you')speaker.Speak('Ooh, just be you')speaker.Speak('You are one of a kind')speaker.Speak('The kind of once in a lifetime')speaker.Speak('Not just another face in the crowd')speaker.Speak('No one can do it just like you')speaker.Speak('Something magic in the way you move')speaker.Speak('You are original, you know it is true')speaker.Speak('do not let anybody take your tune')speaker.Speak('You are not got a single thing to prove')speaker.Speak('You are original, so just be you')speaker.Speak('Just be you')speaker.Speak('Ooh, just be you')speaker.Speak('Ooh, just be you')speaker.Speak('没有人能像你一样')speaker.Speak('那样的充满魔力')speaker.Speak('你知道的,你是最初的你')speaker.Speak('不要让任何人改变你')speaker.Speak('你不需要去证明什么')speaker.Speak('你是最初的你,做你自己')speaker.Speak('做你自己吧')speaker.Speak('你是独一无二的')speaker.Speak('一生仅有一个的那种')speaker.Speak('你不像人群中的另一种面孔')speaker.Speak('你用你内心的温暖')speaker.Speak('照亮了整个房间')speaker.Speak('不要害怕说出来')speaker.Speak('抬起你的头吧')speaker.Speak('不要因为任何人而让你失望')speaker.Speak('没有人能像你一样')speaker.Speak('那样的充满魔力')speaker.Speak('你知道的,你还是最初的你')speaker.Speak('不要让任何人改变你')speaker.Speak('你不用去证明什么')speaker.Speak('因为你就是你')speaker.Speak('做你自己')speaker.Speak('Ooh, just be you')speaker.Speak('做你自己吧')speaker.Speak('Ooh, just be you')speaker.Speak('做你自己')speaker.Speak('你必须要相信')speaker.Speak('你来这一趟是有原因的')speaker.Speak('这个世界需要像你一样的人存在')speaker.Speak('因为任何人都可是一个复制品')speaker.Speak('人们总是在背后指指点点')speaker.Speak('战胜内心的恐惧,去追逐你的梦想')speaker.Speak('假装没有人在看你,自在地舞动吧')speaker.Speak('没有人能像你一样')speaker.Speak('那样的充满魔力')speaker.Speak('你知道的,你还是最初的你')speaker.Speak('不要因为任何人而改变你自己')speaker.Speak('你也不用去证明什么')speaker.Speak('你就是最初的你')speaker.Speak('做你自己')speaker.Speak('做你自己吧')speaker.Speak('做你自己')speaker.Speak('你是独一无二的')speaker.Speak('一生仅有一个的那种')speaker.Speak('不像人群中的另一种面孔')speaker.Speak('没有人像你')speaker.Speak('如此有魔力')speaker.Speak('你也知道的,你还是原本的你')speaker.Speak('不要让任何人改变你')speaker.Speak('你不需要去证明什么')speaker.Speak('你还是原来的你')speaker.Speak('做你自己')speaker.Speak('做你自己吧')speaker.Speak('Ooh, just be you')speaker.Speak('做你自己吧')# 释放对象del speaker

  如果你没有出错,打开电脑的声音,就能听到语音(把我们刚才在代码里写的文本文字转换成语音播报出来了)

(2)、文本转存为语音文件wav

(a)、用SpeechLib库

方法:1.从文本文件中获取输入语音的文本内容,将其转换为语音,保存成.wav格式

使用 SpeechLib,需要先安装, 命令如下:

  • pip install comtypes
from comtypes.client import CreateObjectengine = CreateObject('SAPI.SpVoice')stream = CreateObject('SAPI.SpFileStream')from comtypes.gen import SpeechLibinfile = '就算世界无童话.txt'outfile = '就算世界无童话.wav'stream.open(outfile, SpeechLib.SSFMCreateForWrite)engine.AudioOutputStream = streamf = open(infile, 'r', encoding='utf-8')theText = f.read()f.close()stream.close()

  如果你没有出错,电脑里同一个目录里出现了转换好的语音文件“ 就算世界无童话.wav ”

三、总结

  本文主要从概念上图文论述了语音识别的起源与发展、语音识别的基本原理、语音识别过程、语音识别的近期发展。

  代码上分析了Python 语音识别所用到的技术,从 (1)、文本转换为语音。(2)、文本转存为语音文件wav。两个方面实例操作了语音识别的技术实现方式,并提供了完整源代码供参考。

  python语音识别还有其他的方法,例如从话筒等输入语音来识别,这些将会在后面更新博文时再详细分析。

          推荐阅读:

计算机视觉__基本图像操作(显示、读取、保存)直方图(颜色直方图、灰度直方图)直方图均衡化(调节图像亮度、对比度)

 语音识别实战(python代码)(一)

 人工智能基础篇

 计算机视觉基础__图像特征

93d65dbd09604c4a8ed2c01df0eebc38.png

 matplotlib 自带绘图样式效果展示速查(28种,全)

074cd3c255224c5aa21ff18fdc25053c.png

Three.js实例详解___旋转的精灵女孩(附完整代码和资源)(一)

fe88b78e78694570bf2d850ce83b1f69.png

cb4b0d4015404390a7b673a2984d676a.png

立体多层玫瑰绘图源码__玫瑰花python 绘图源码集锦

 Python 3D可视化(一)

 让你的作品更出色——词云Word Cloud的制作方法(基于python,WordCloud,stylecloud)

e84d6708316941d49a79ddd4f7fe5b27.png

938bc5a8bb454a41bfe0d4185da845dc.jpeg

0a4256d5e96d4624bdca36433237080b.png

 python Format()函数的用法___实例详解(一)(全,例多)___各种格式化替换,format对齐打印

 用代码写出浪漫__合集(python、matplotlib、Matlab、java绘制爱心、玫瑰花、前端特效玫瑰、爱心)

python爱心源代码集锦(18款)

dc8796ddccbf4aec98ac5d3e09001348.jpeg

0f09e73712d149ff90f0048a096596c6.png

40e8b4631e2b486bab2a4ebb5bc9f410.png

 Python中Print()函数的用法___实例详解(全,例多)

 Python函数方法实例详解全集(更新中...)

 《 Python List 列表全实例详解系列(一)》__系列总目录、列表概念

09e08f86f127431cbfdfe395aa2f8bc9.png

用代码过中秋,python海龟月饼你要不要尝一口?

 python练习题目录

03ed644f9b1d411ba41c59e0a5bdcc61.png

daecd7067e7c45abb875fc7a1a469f23.png

17b403c4307c4141b8544d02f95ea06c.png

草莓熊python turtle绘图(风车版)附源代码

 ​草莓熊python turtle绘图代码(玫瑰花版)附源代码

 ​草莓熊python绘图(春节版,圣诞倒数雪花版)附源代码

4d9032c9cdf54f5f9193e45e4532898c.png

c5feeb25880d49c085b808bf4e041c86.png

 巴斯光年python turtle绘图__附源代码

皮卡丘python turtle海龟绘图(电力球版)附源代码

vue3 项目搭建教程(基于create-vue,vite,Vite + Vue)

fea225cb9ec14b60b2d1b797dd8278a2.png

bba02a1c4617422c9fbccbf5325850d9.png

37d6aa3e03e241fa8db72ccdfb8f716b.png

2023年春节祝福第二弹——送你一只守护兔,让它温暖每一个你【html5 css3】画会动的小兔子,炫酷充电,字体特

 别具一格,原创唯美浪漫情人节表白专辑,(复制就可用)(html5,css3,svg)表白爱心代码(4套)

SVG实例详解系列(一)(svg概述、位图和矢量图区别(图解)、SVG应用实例)

5d409c8f397a45c986ca2af7b7e725c9.png

6176c4061c72430eb100750af6fc4d0e.png

1f53fb9c6e8b4482813326affe6a82ff.png

【程序人生】卡塔尔世界杯元素python海龟绘图(附源代码),世界杯主题前端特效5个(附源码)HTML+CSS+svg绘制精美彩色闪灯圣诞树,HTML+CSS+Js实时新年时间倒数倒计时(附源代码)

 2023春节祝福系列第一弹(上)(放飞祈福孔明灯,祝福大家身体健康)(附完整源代码及资源免费下载)

80007dbf51944725bf9cf4cfc75c5a13.png

1ab685d264ed4ae5b510dc7fbd0d1e55.jpeg

1750390dd9da4b39938a23ab447c6fb6.jpeg

 Node.js (v19.1.0npm 8.19.3) vue.js安装配置教程(超详细)

 色彩颜色对照表(一)(16进制、RGB、CMYK、HSV、中英文名)

2023年4月多家权威机构____编程语言排行榜__薪酬状况

aa17177aec9b4e5eb19b5d9675302de8.png

38266b5036414624875447abd5311e4d.png

6824ba7870344be68efb5c5f4e1dbbcf.png

 手机屏幕坏了____怎么把里面的资料导出(18种方法)

【CSDN云IDE】个人使用体验和建议(含超详细操作教程)(python、webGL方向)

 查看jdk安装路径,在windows上实现多个java jdk的共存解决办法,安装java19后终端乱码的解决

fffa2098008b4dc68c00a172f67c538d.png

5218ac5338014f389c21bdf1bfa1c599.png

c6374d75c29942f2aa577ce9c5c2e12b.png

 tomcat11、tomcat10 安装配置(Windows环境)(详细图文)

 Tomcat端口配置(详细)

 Tomcat 启动闪退问题解决集(八大类详细)

来源地址:https://blog.csdn.net/weixin_69553582/article/details/129943496

--结束END--

本文标题: 语音识别实战(python代码)(一)

本文链接: https://lsjlt.com/news/385744.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 语音识别实战(python代码)(一)
    语音识别实战   (python :pyttsx、SAPI、SpeechLib实例代码)(一) 本文目录: 一、语音识别的基本原理 (1)、语音识别的起源与发展 (2)、语音识别的基本原理 (3)、语音识别过程 (4)、语音识别的近期发展...
    99+
    2023-08-31
    语音识别 人工智能 深度学习 python 开发语言
  • Android实现语音识别代码
    苹果的iphone 有语音识别用的是Google 的技术,做为Google 力推的Android 自然会将其核心技术往Android 系统里面植入,并结合google 的云端技...
    99+
    2022-06-06
    语音识别 Android
  • python语音识别
    语音识别技术,也被称为自动语音识别,目标是以电脑自动将人类的语音内容转换为相应的文字。应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。一、功能概述实现将语音转换为文字,调取第3方接口。比如百度ai,图灵机器人,...
    99+
    2023-01-30
    语音识别 python
  • Android语音识别技术详解及实例代码
       今天从网上找了个例子实现了语音识别,个人感觉挺好玩的,就把代码贴出来与大家分享下:      &nb...
    99+
    2022-06-06
    Android
  • Android 轻松实现语音识别详解及实例代码
    使用Intent调用语音识别程序 说明 Android中主要通过RecognizerIntent来实现语音识别,其实代码比较简单,但是如果找不到语音识别设备,就会抛出异常 Ac...
    99+
    2022-06-06
    语音识别 Android
  • Python中怎么实现语音识别
    今天就跟大家聊聊有关Python中怎么实现语音识别,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。离线转换对于国内的网络环境,无法用google API来将语音数据转换成文本文件,因为...
    99+
    2023-06-16
  • 基于Python实现语音识别和语音转文字
    目录前言直接使用获取权限1.环境准备2.获取权限代码实现1.获取access_token2.获取转换后音频3.配置接口参数4.完整demo5.执行前言 嗨嗨,大家好呀 ~ 今天给你们...
    99+
    2024-04-02
  • Python实战之手势识别控制电脑音量
    目录一、环境配置二、代码介绍三、使用方式今天给大家带来一个OpenCV的实战小项目——手势识别控制电脑音量 先上个效果图: 通过大拇指和食指间的开合距离来...
    99+
    2023-05-18
    Python手势识别控制电脑音量 Python手势识别 Python控制音量
  • Android使用百度语音识别的示例代码
    本文使用百度语音识别,完成语音识别的功能,使用百度语音识别,先要申请APP ID,这个直接到百度网站上有说明文档,本文不再赘述。申请之后,下载SDK包,按照百度官网要求,合并l...
    99+
    2022-06-06
    示例 语音识别 Android
  • Python如何进行语音识别,语音转换功能实现
    Python如何进行语音识别,语音转换功能实现,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。相信大家都非常喜欢那些萝莉音,看那些女装大佬,开一个变声器声音实在是很有诱惑力,下面...
    99+
    2023-06-02
  • python语音识别whisper的使用
    目录一、背景二、whisper语音识别三、示例四、封装工具一、背景 最近想提取一些视频的字幕,语音文案,研究了一波 二、whisper语音识别 Whisper 是一种通用的语音识别模...
    99+
    2023-02-27
    python语音识别whisper python whisper
  • python实现人脸识别代码
    从实时视频流中识别出人脸区域,从原理上看,其依然属于机器学习的领域之一,本质上与谷歌利用深度学习识别出猫没有什么区别。程序通过大量的人脸图片数据进行训练,利用数学算法建立建立可靠的人脸特征模型,如此即可识别...
    99+
    2022-06-04
    代码 python
  • Java 离线中文语音文字识别功能的实现代码
    目录1、pom文件如下:2、工程结构:3、语音识别工具类4、前端交互5、前端页面6、运行效果项目需要,要实现类似小爱同学的语音控制功能,并且要离线,不能花公司一分钱。第一步就是需要把...
    99+
    2024-04-02
  • 这一篇就够了 python语音识别指南终
    【导读】亚马逊的 Alexa 的巨大成功已经证明:在不远的将来,实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是,在 Python 程序中实现...
    99+
    2023-01-31
    这一 语音识别 指南
  • Python语音识别API实现文字转语音的几种方法
    搜狗(目前好用,免费) def textToAudio_Sougou(message, filePath): # https://ai.so gou.c...
    99+
    2024-04-02
  • JavaScript如何实现语音识别
    这篇文章将为大家详细讲解有关JavaScript如何实现语音识别,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。这里介绍一个开源的JavaScript语言输入库,名叫ann...
    99+
    2024-04-02
  • Android基于讯飞语音SDK实现语音识别
    一、准备工作 1、你需要android手机应用开发基础 2、科大讯飞语音识别SDK android版 3、科大讯飞语音识别开发API文档 4、android手机 关于科大讯飞S...
    99+
    2022-06-06
    讯飞 sdk 语音识别 Android
  • Python语音识别的示例分析
    这篇文章给大家分享的是有关Python语音识别的示例分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。概述将开启一个新的深度学习章节, 为大家来讲述一下深度学习在语音识别 (Speech Recognition)...
    99+
    2023-06-25
  • python语音识别whisper如何使用
    这篇文章主要介绍了python语音识别whisper如何使用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇python语音识别whisper如何使用文章都会有所收获,下面我们一起来看看吧。whisper语音识别...
    99+
    2023-07-05
  • python语音识别的转换方法
    使用pyttsx的python包,你可以将文本转换为语音。 安装命令 pip install pyttsx3 -i https://pypi.tuna.tsinghua.edu.c...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作