语音识别

基于React-Native0.55.4的语音识别项目全栈方案

移动端的API能力验证方案与PC端不一样！不一样！！不一样！！！即使需要使用的API都存在，也不一定能用，这一点和PC端是有很大区别的，国内的手机系统虽然都是基于Android,但几乎都会经过各大厂商的定制，功能...
2023-06-26编程教程方案,语音识别,项目
基于React-Native0.55.4的语音识别项目全栈方案

移动端的API能力验证方案与PC端不一样！不一样！！不一样！！！即使需要使用的API都存在，也不一定能用，这一点和PC端是有很大区别的，国内的手机系统虽然都是基于Android,但几乎都会经过各大厂商的定制，功能...
2023-06-26编程教程方案,语音识别,项目
利用百度语音API进行语音识别。

由于项目需要，这几天都在试图利用百度语音API进行语音识别。但是识别到的都是“啊，哦”什么的，我就哭了。这里我只是分享一下这个过程，错误感觉出现在Post语音数据那一块，可能是转换问题吧。 API...
2023-06-20编程教程利用,语音,语音识别
FreeSWITCH对接vosk实现实时语音识别

环境：CentOS 7.6_x64 FreeSWITCH版本：1.10.9 Python版本：3.9.2 一、背景描述 vosk是一个开源语音识别工具，可识别中文，之前介绍过python使用vosk进行中文语音识别，今天记录下FreeSWITCH对接vosk实现实时语...
2023-06-05编程教程实时,对接,语音识别
WP中的语音识别（下）：语音指令

除了系统集成的可以用于搜索、启动应用程序等语音命令外，在我们的应用程序内部还能自己定义语音指令，使得我们的APP能与语音操控结合得更加完全。语音指令是通过一个XML文件来定义的。比如，咱小舅子开了家饭店...
2023-05-06编程教程指令,语音,语音识别
FastCorrect：语音识别快速纠错模型丨RTC Dev Meetup

前言「语音处理」是实时互动领域中非常重要的一个场景，在声网发起的「RTC Dev Meetup丨语音处理在实时互动领域的技术实践和应用」活动中，来自百度、寰宇科技和依图的技术专家，围绕该话题进行了相关分享。本...
2023-05-06编程教程模型,纠错,语音识别
C# 语音识别（文字to语音、语音to文字）

最近打算研究一下语音识别，但是发现网上很少有C#的完整代码，就把自己的学习心得放上来，和大家分享一下。下载API： 1）SpeechSDK51.exe &n...
2023-05-04编程教程文字,语音,语音识别
Python实时语音识别控制

代码地址如下：http://www.demodashi.com/demo/12946.html Python实时语音识别控制概述本文中的语音识别功能采用百度语音识别库，首先利用 PyAudio 库录制语音指令，保存为受支持的 wav 音频文件，然后利用...
2023-05-04编程教程实时,控制,语音识别
python使用vosk进行中文语音识别

操作系统：Windows10 Python版本：3.9.2 vosk是一个离线开源语音识别工具，它可以识别16种语言，包括中文。这里记录下使用vosk进行中文识别的过程，以便后续查阅。 vosk地址：https://alphacephei.com/vosk/ 使...
2023-05-04编程教程python,中文,语音识别
[Python]语音识别媒体中的音频到文本

@ 目录准备工作视频转音频识别音频到文本音频直接转换文本准备工作安装python3环境申请一个可用的语音转换API，此篇以Microsoft Azure Speech为例在Microsoft Azure 市场中搜索speech关键字找到语音服务...
2023-04-23编程教程文本,语音识别,音频
ROS kinetic语音识别

1.安装依赖 1.1安装ros-kinetic-audio-common sudo apt-get install ros-kinetic-audio-common 1.2 安装libasound2 sudo apt-get install libasound2 1.3 安装libgstreamer0.10 sudo apt-get install gstreamer0...
2023-03-18编程教程Kinetic,ros,语音识别
Atitit 语音识别的技术原理

Atitit 语音识别的技术原理 1.1. 语音识别技术，也被称为自动语音识别Automatic Speech Recognition，(ASR)，2 1.2. 模型目前，主流的大词汇量语音识别系统多采用统计模式识别技术2 1.3. 基本方法般来说,语音识别...
2023-03-18编程教程原理,技术,语音识别
基于OpenSeq2Seq的NLP与语音识别混合精度训练

基于OpenSeq2Seq的NLP与语音识别混合精度训练 Mixed Precision Training for NLP and Speech Recognition with OpenSeq2Seq 迄今为止，神经网络的成功建立在更大的数据集、更好的理论模型和缩短的训练时间上。特...
2023-03-18编程教程混合,精度,语音识别
Kaldi语音识别快速入门

一.简介　　Kaldi是使用C++编写的语音识别工具包，Apache License v2.0许可。主要供语音识别研究人员使用。Kaldi的目标和范围与HTK类似。目标是拥有易于修改和扩展的现代而灵活的代码。主要功能包括：　　1.与...
2023-03-18编程教程入门,快速,语音识别
MRCPv2在电信智能语音识别业务中的应用

1. MRCPv2协议简介媒体资源控制协议(Media Resource Control Protocol, MRCP)是一种基于TCP/IP的通讯协议，用于客户端向媒体资源服务器请求提供各种媒体资源服务。此协议是由Cisco、Nuance等公司联合开发，由IET...
2023-03-18编程教程业务,电信,语音识别
基于百度语音识别API的Python语音识别小程序

一、功能概述实现语音为文字，可以扩展到多种场景进行工作，这里只实现其基本的语言接收及转换功能。在语言录入时，根据语言内容的多少与停顿时间，自动截取音频进行转换。工作示例：二、软件环境操作系统：...
2023-03-18编程教程api,程序,语音识别
python基于百度unit实现语音识别与语音交互

一、百度Unit新建机器人网址：https://ai.baidu.com/tech/speech/asr： 1、新建机器人并添加预置技能步骤（1）、新建机器人（添加预置技能），并填写机器人具体信息（2）、进入新建的机器人 -> 选择技能管...
2023-03-05编程教程交互,语音,语音识别
基于语音识别、音文同步、图像OCR的字幕解决方案HtwMedia介绍

　　背景介绍　　俗话说，“好记性不如乱笔头”，这充分说明了文字归档的重要性。如今随着微信、抖音等移动端app的使用越来越广，人们生产音、视频内容也越来越便捷。而相比语音和视频而言，文字具有...
2023-02-17编程教程同步,图像,字幕,解决方案,语音识别
闻其声而知雅意,基于Pytorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)

前文回溯，之前一篇：含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入)，利用AI技术将文本合成语音，现在反过来，利用开源库Whisper再将语音转回文字，所谓闻其声而知雅意。 W...
2023-02-14编程教程人工智能,语音识别
(转) 机器学习很有趣Part6：怎样使用深度学习进行语音识别

本文转自：http://www.jiqizhixin.com/article/2321 机器学习很有趣Part6：怎样使用深度学习进行语音识别 2017-02-19 13:20:47 机器学习 00 0 还记得machine learning...
2023-01-04站长百科学习,很有趣,机器,深度,语音识别

语音识别

基于React-Native0.55.4的语音识别项目全栈方案

基于React-Native0.55.4的语音识别项目全栈方案

利用百度语音API进行语音识别。

FreeSWITCH对接vosk实现实时语音识别

WP中的语音识别（下）：语音指令

FastCorrect：语音识别快速纠错模型丨RTC Dev Meetup

C# 语音识别（文字to语音、语音to文字）

Python实时语音识别控制

python使用vosk进行中文语音识别

[Python]语音识别媒体中的音频到文本

ROS kinetic语音识别

Atitit 语音识别的技术原理

基于OpenSeq2Seq的NLP与语音识别混合精度训练

Kaldi语音识别快速入门

MRCPv2在电信智能语音识别业务中的应用

基于百度语音识别API的Python语音识别小程序

python基于百度unit实现语音识别与语音交互

基于语音识别、音文同步、图像OCR的字幕解决方案HtwMedia介绍

闻其声而知雅意,基于Pytorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)

(转) 机器学习很有趣Part6：怎样使用深度学习进行语音识别