Android系统本身其实提供有语音识别模块,在它的APIDemo里也有关于语音识别的sample,不过经过大多开发者的真机测试,发现很多真机并不能使用哪个sample,在网上查找了一下原因,大部分是因为开发者在刷机的时候,大部分的ROM都阉割掉了语音识别和语音合成TTS(Text To Speech)部分,所以运行sample的时候会有异常抛出。
如果不用google提供的语音识别,要怎么实现语音识别喃?科大讯飞的语音API就可以到,这里是关于它的官网介绍:http://dev.voicecloud.cn/developer.php?vt=1 下面我就用一个简单的实例来介绍一下它基本的使用
首先做一个简单的界面
上面的TextView显示识别的内容,三个Button分别为语音识别,语音合成并朗读和语音后台朗读三个功能
布局文件:
- <?xml version="1.0" encoding="utf-8"?>
- <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"
- android:layout_width="fill_parent"
- android:layout_height="fill_parent"
- android:orientation="vertical" >
- <EditText
- android:id="@+id/et"
- android:layout_width="fill_parent"
- android:layout_height="wrap_content" />
- <Button
- android:id="@+id/bt_recognize"
- android:layout_width="fill_parent"
- android:layout_height="wrap_content"
- android:gravity="center"
- android:text="Recognize" />
- <Button
- android:id="@+id/bt_speek"
- android:layout_width="fill_parent"
- android:layout_height="wrap_content"
- android:gravity="center"
- android:text="Speek" />
- <Button
- android:id="@+id/bt_speek_bg"
- android:layout_width="fill_parent"
- android:layout_height="wrap_content"
- android:gravity="center"
- android:text="Speek-Background" />
- </LinearLayout>
Activity代码如下:
- package sina.CreAmazing.voice;
- import java.util.ArrayList;
- import com.iflytek.speech.RecognizerResult;
- import com.iflytek.speech.SpeechError;
- import com.iflytek.speech.SynthesizerPlayer;
- import com.iflytek.ui.RecognizerDialog;
- import com.iflytek.ui.RecognizerDialogListener;
- import com.iflytek.ui.SynthesizerDialog;
- import com.iflytek.ui.SynthesizerDialogListener;
- import android.app.Activity;
- import android.os.Bundle;
- import android.view.View;
- import android.view.View.OnClickListener;
- import android.widget.Button;
- import android.widget.EditText;
- public class Voice1Activity extends Activity {
- /** Called when the activity is first created. */
- // 声明控件
- private EditText et;
- private Button bt1;
- private Button bt2;
- private Button bt3;
- //全局只设一个String,因为String为final类型,这样做节省内存
- String text = "";
- private static final String APPID = "appid=4f2d3a06";
- @Override
- public void onCreate(Bundle savedInstanceState) {
- super.onCreate(savedInstanceState);
- setContentView(R.layout.main);
- bt1 = (Button) findViewById(R.id.bt_recognize);
- bt2 = (Button) findViewById(R.id.bt_speek);
- bt3 = (Button) findViewById(R.id.bt_speek_bg);
- et = (EditText) findViewById(R.id.et);
- // 初始化监听器
- initListener();
- }
- private void initListener() {
- bt1.setOnClickListener(myListener);
- bt2.setOnClickListener(myListener);
- bt3.setOnClickListener(myListener);
- }
- OnClickListener myListener = new OnClickListener() {
- @Override
- public void onClick(View v) {
- // 根据不同View的id调用不同方法
- switch (v.getId()) {
- case R.id.bt_recognize:
- // 这是语言识别部分,最重要的实例化一个
- // RecognizerDialog并把你在官方网站申请的appid填入进去,非法id不能进行识别
- RecognizerDialog isrDialog = new RecognizerDialog(
- Voice1Activity.this, APPID);
- /*
- * 设置引擎目前支持五种 ”sms”:普通文本转写 “poi”:地名搜索 ”vsearch”:热词搜索
- * ”video”:视频音乐搜索 ”asr”:命令词识别
- */
- isrDialog.setEngine("sms", null, null);
- isrDialog.setListener(recoListener);
- isrDialog.show();
- break;
- case R.id.bt_speek:
- // 这是语言合成部分 同样需要实例化一个SynthesizerDialog ,并输入appid
- SynthesizerDialog syn = new SynthesizerDialog(
- Voice1Activity.this, APPID);
- syn.setListener(new SynthesizerDialogListener() {
- @Override
- public void onEnd(SpeechError arg0) {
- }
- });
- // 根据EditText里的内容实现语音合成
- syn.setText(et.getText().toString(), null);
- syn.show();
- break;
- case R.id.bt_speek_bg:
- // 这是后台朗读,实例化一个SynthesizerPlayer
- SynthesizerPlayer player = SynthesizerPlayer
- .createSynthesizerPlayer(Voice1Activity.this, APPID);
- // 设置语音朗读者,可以根据需要设置男女朗读,具体请看api文档和官方论坛
- player.setVoiceName("vivixiaomei");
- player.playText(et.getText().toString(), "ent=vivi21,bft=5",
- null);
- break;
- default:
- break;
- }
- }
- };
- // 语言识别监听器,有两个方法
- RecognizerDialogListener recoListener = new RecognizerDialogListener() {
- @Override
- public void onResults(ArrayList<RecognizerResult> results,
- boolean isLast) {
- // 服务器识别完成后会返回集合,我们这里就只得到最匹配的那一项
- text += results.get(0).text;
- System.out.println(text);
- }
- @Override
- public void onEnd(SpeechError error) {
- if (error == null) {
- // 完成后就把结果显示在EditText上
- et.setText(text);
- }
- }
- };
- }
最后别忘了把科大讯飞的jar包引入工程的buildPath里面。
运行画面:
语音识别:
语音合成:
其实功能还不止这些,还有数据上传,关键字识别,获取上行下行流量,设置采样频率设置发音人,语速,音量等等等,如果感兴趣可以自己深入研究。
相关推荐
语音转写基于科大讯飞WebApi接口的安卓实现--上传录音音频翻译成文字 实现方法链接:https://blog.csdn.net/qq_33315364/article/details/104668152#comments_12152992
语音识别计算器,基于科大讯飞api。功能: 说话->语音识别->计算得到结果
代码是简单的语音识别demo,使用的是科大讯飞的api,想看的同学可以看看。
科大讯飞语音的集成,含有语音识别、语音转换、语音唤醒,注意:demo需要在project里面直接导入
科大讯飞开发文档针对Android开发语音识别,离线语音合成等API介绍
该语音助手界面仿照苹果的SIRI,采用科大讯飞的API做语音和语义识别,包括打电话、发短信、打开应用、翻译、聊天机器人等数十项功能
由于最近在做智能家居方向的产品,需要在App上对机器人实现一个简单的语音控制,于是开始寻找相应的解决方案,由于某种原因,google自己的语音识别API并不能在国内发挥作用,所以我们选择国内的科大讯飞语音识别服务...
适合android语音开发者,对语音api调用
2、科大讯飞语音识别SDK android版 3、科大讯飞语音识别开发API文档 4、android手机 关于科大讯飞SDK及API文档,请到科大语音官网下载:http://www.xfyun.cn/ 当然SDK和API有多个版本可选,按照你的需要下载,其次,...
这里调用科大讯飞语音的API,语音云开放平台介绍 调用科大讯飞语音的API,需要加添库文件Msc.jar,添加libmsc.so文件,还需添加权限,具体步骤可参看SDK里的文档 参看开发的文档写了一个简单的语音合成和识别demo,图示...
集成百度、科大讯飞、阿里、腾讯等多家中文语音识别和语音合成技术,且可以继续扩展。 对话机器人支持。支持基于 AnyQ 的本地对话机器人,并支持接入图灵机器人、Emotibot 等在线对话机器人。 全局监听,离线唤醒。...