网络赚钱平台

    # 語音聽寫 Android SDK 文檔

    # 1、簡介

    發音聽寫,是對于理所當然言語除理,將理所當然言話音頻系統文件轉換成為文本系統文件讀取的技術應用性。發音聽寫技術應用性與日語日語語法辨別技術應用性的不一樣的是在于,發音聽寫不可以對于某些具體實施的日語日語語法系統文件,其辨別位置是整語種內的詞條。

    自2019/8/16起,高階工作-動態性調整兔費開放式!可到這里 動態修正效果 (opens new window) 在線體驗
    使用方法詳見 動態修正

    在聽寫時,可以上傳個性化的詞表,如聯系人列表等,提高列表中詞語的匹配率(詳情見個性化熱詞設置)。

    語音聽寫詳細的接口介紹及說明請參考: MSC Android API 文檔 (opens new window)

    在集成過程中出現錯誤,請優先查詢SDK&API 錯誤碼查詢 (opens new window)。如有疑問,請提交進行咨詢,也可登錄與廣大開發者共同學習和交流。

    小語種

    • 目前小語種已經適配日語、俄語、西班牙語、法語、韓語,其他小語種敬請期待!

    # 2、SDK集成指南

    # 2.1、Demo運行步驟

    根據官網提示,直接下載SDK,SDK中包含簡易可運行的Demo。如下圖所示:

    備注:Android sdk目前支持android4.4及以上系統,同時建議真機調試。
    下載完SDK后,解壓至相應的路徑,以Android Studio集成開發工具為例,測試時建議直接用真機進行測試。

    # 方法一(導入project方式):

    打開Android Studio,在菜單欄File--->new--->import project當前解壓sdk路徑,使用在線服務能力選擇導入SpeechDemo,如下圖所示:

    導入成功之后sync編譯下,編譯無誤可連接手機,開啟手機USB開發調試模式,直接在Android Studio運行導入的Speechdemo,最后生成的apk可直接安裝在對應的手機上,如下圖所示:

    如果編譯時出現“ERROR: Plugin with id 'com.android.application' not found.”錯誤,請在build.gradle文件中添加以下代碼。

    buildscript {
        repositories {
            google()
            jcenter()
        }
        dependencies {
             //版本號信息號請按照其她的gradle3d插件版本號信息號擅自改變
            classpath 'com.android.tools.build:gradle:3.4.0'
            // NOTE: Do not place your application dependencies here; they belong
            // in the individual module build.gradle files
        }
    }
    

    如在導入項目中還出現其他問題,可參考帖子:

    # 方法二(導入module方式):

    訪問Android Studio,在菜單名稱欄File--->new--->import module在當下解壓sdk渠道,動用在線免費貼心服務功能確定加入SpeechDemo。 加入順利然后sync編譯下,編譯沒有錯誤后可連結安卓小米智能手機,切換安卓小米智能手機USB設計規劃程序調試狀態,同時在Android Studio運作加入的Speechdemo,最后一步形成的apk可同時按裝在應對的安卓小米智能手機子。

    # 2.2、項目集成步驟

    # 2.2.1、SDK包說明

    《Android SDK根目錄機構總覽》
    • manifests:
      • android配置應用權限文件
    • sample:
      • 相關在線能力demo(語音聽寫IatDemo)
    • assets:
      • SDK相關資源配置文件
    • Libs:
      • 動態庫和jar包
    • res:
      • UI文件和相關布局文件xml
    • readme說明(必看)
    • release 版本說明

    # 2.2.2、導入SDK

    將在客服電話下載軟件的Android SDK 縮減包中libs目次下全部子文件名仿制至Android工程建筑的libs目次下。方式圖如下圖所示:

    注:
    1. arm版本已經逐步淘汰了,arm架構的推薦使用armeabi-v7a。
    2. 如果您需要將應用push到設備使用,請將設備cpu對應指令集的libmsc.so push到/system/lib中。
    3. 集成到項目,需要將sdk中Demo/src/main/下文件拷貝到項目main中,以AS為例,且需要在項目main文件夾下新建Jnilibs并拷貝libmsc.so
    4. msc.jar需要拷貝至項目libs下,并且右鍵jar添加Add As Library。
    5. sdk下文件夾main/assets/,自帶UI頁面(iflytek文件夾)和相關其他服務資源文件(語法文件、音頻示例、詞表),使用自帶UI接口時,可以將assets/iflytek文件拷貝到項目中;

    # 2.2.3、添加用戶權限

    在過程中 AndroidManifest.xml 系統文件中增加以下幾點授權管理
    <!--連接網絡權限,用于執行网络赚钱平台端語音能力 -->
    <uses-permission android:name="android.permission.INTERNET"/>
    <!--獲取手機錄音機使用權限,聽寫、識別、語義理解需要用到此權限 -->
    <uses-permission android:name="android.permission.RECORD_AUDIO"/>
    <!--讀取網絡信息狀態 -->
    <uses-permission android:name="android.permission.ACCESS_NETWORK_STATE"/>
    <!--獲取當前wifi狀態 -->
    <uses-permission android:name="android.permission.ACCESS_WIFI_STATE"/>
    <!--允許程序改變網絡連接狀態 -->
    <uses-permission android:name="android.permission.CHANGE_NETWORK_STATE"/>
    <!--讀取手機信息權限 -->
    <uses-permission android:name="android.permission.READ_PHONE_STATE"/>
    <!--讀取聯系人權限,上傳聯系人需要用到此權限 -->
    <uses-permission android:name="android.permission.READ_CONTACTS"/>
    <!--外存儲寫權限,構建語法需要用到此權限 -->
    <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/>
    <!--外存儲讀權限,構建語法需要用到此權限 -->
    <uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE"/>
    <!--配置權限,用來記錄應用配置信息 -->
    <uses-permission android:name="android.permission.WRITE_SETTINGS"/>
    <!--手機定位信息,用來為語義等功能提供定位,提供更精準的服務-->
    <!--定位信息是敏感信息,可通過Setting.setLocationEnable(false)關閉定位請求 -->
    <uses-permission android:name="android.permission.ACCESS_FINE_LOCATION"/>
    <!--如需使用人臉識別,還要添加:攝像頭權限,拍照需要用到 -->
    <uses-permission android:name="android.permission.CAMERA" />
    
    留意:如需要符合包裝亦或合成APK的時刻使用相混淆,請在proguard.cfg中調用下面的編號:
    -keep class com.iflytek.**{*;}
    -keepattributes Signature
    

    # 2.2.4、初始化

    缺省化即創辦語音系統運行環境文本,就有缺省化后才不錯運行MSC的各個服務于。推薦 將缺省化貼到過程進口處(如Application、Activity的onCreate形式),缺省化代碼怎么用有以下幾點:
    // 將“12345678”轉換為您公司申請辦理的APPID,公司申請辦理詳細地址:http://teknisi-computer.com
    // 溫馨提示在“=”與appid范圍內更改某些空標識符和轉義符
    SpeechUtility.createUtility(context, SpeechConstant.APPID +"=12345678");
    

    # 2.2.5、常用參數說明

    參數名稱 名稱 說明
    domain 應用領域 應用領域
    iat:日常用語
    medical:醫療
    :醫療領域若未授權無法使用,可到控制臺-語音聽寫(流式版)-高級功能處添加試用或購買;若未授權無法使用會報錯11200。
    language 語言區域 選擇要使用的語言區域,目前Android SDK支持
    zh_cn:中文
    en_us:英文
    ja_jp:日語
    ko_kr:韓語
    ru-ru:俄語
    fr_fr:法語
    es_es:西班牙語
    注:小語種若未授權無法使用會報錯11200,可到控制臺-語音聽寫(流式版)-方言/語種處添加試用或購買。
    accent 方言 當前僅在LANGUAGE為簡體中文時,支持方言選擇,其他語言區域時,可把此參數值設為mandarin。默認值:mandarin,其他方言參數可在控制臺方言一欄查看。
    vad_bos 前端點檢測 開始錄入音頻后,音頻前面部分最長靜音時長,取值范圍[0,10000ms],默認值5000ms
    vad_eos 后端點檢測 開始錄入音頻后,音頻后面部分最長靜音時長,取值范圍[0,10000ms],默認值1800ms。
    sample_rate 采樣率 支持:8KHz(僅在線支持),16KHz
    nbest 句子多候選 通過設置此參數,獲取在發音相似時的句子多候選結果。設置多候選會影響性能,響應時間延遲200ms左右。取值范圍:聽寫[1,5]。
    注:該擴展功能若未授權無法使用,可到控制臺-語音聽寫(流式版)-高級功能處免費開通;若未授權狀態下設置該參數并不會報錯,但不會生效。
    wbest 詞語多候選 通過設置此參數,獲取在發音相似時的詞語多候選結 果。設置多候選會影響性能,響應時間延遲200ms左右。取值范圍:聽寫[1,5]。
    注:該擴展功能若未授權無法使用,可到控制臺-語音聽寫(流式版)-高級功能處免費開通;若未授權狀態下設置該參數并不會報錯,但不會生效。
    result_type 結果類型 結果類型包括:xml, json, plain。xml和json即對應的結構化文本結構,plain即自然語言的文本。
    nunum 數字結果 通過設置此參數可偏向輸出數字結果格式
    0:傾向于漢字,
    1:傾向于數字,
    設置方式:mIat.setParameter("nunum", "0")
    ptt 標點符號 (僅中文支持)標點符號添加
    1:開啟(默認值)
    0:關閉

    注: 多候選效果是由引擎決定的,并非絕對的。即使設置了多候選,如果引擎并沒有識別出候選的詞或句,返回結果也還是單個。

    備注欄:上述均為SDK通常用指標情況說明,均在setParam()的方法之中裝置,裝置樣例:mIat.setParameter(SpeechConstant.LANGUAGE, "en_us");很多詳細的指標請參考資料:.

    # 2.2.6、在線聽寫UI設置

    sdk保證了二種判斷辦法,分開為帶UI判斷和無UI辦法:
    # 2.2.6.1、無UI識別
    //剛開始化面部設別無UI面部設別物體
    //用到SpeechRecognizer的對象,可只能根據調整發消息自定位表層;
    mIat = SpeechRecognizer.createRecognizer(IatDemo.this, mInitListener);
    
    //設立英語語法結構ID和 SUBJECT 為空,以避免因以前有英語語法結構資源調用而設立了此產品技術指標;或同時清洗所以產品技術指標,實際上可參考資料 DEMO 的實例。
    mIat.setParameter( SpeechConstant.CLOUD_GRAMMAR, null );
    mIat.setParameter( SpeechConstant.SUBJECT, null );
    //設制獲取報告論文論文格式,現今使用json,xml甚至plain 幾種論文論文格式,在這其中plain為純聽寫備份文本方式
    mIat.setParameter(SpeechConstant.RESULT_TYPE, "json");
    //這兒engineType為“cloud”
    mIat.setParameter( SpeechConstant.ENGINE_TYPE, engineType );
    //設立視頻語音輸入言語,zh_cn為簡體英文版
    mIat.setParameter(SpeechConstant.LANGUAGE, "zh_cn");
    //制定的結果調用語言學
    mIat.setParameter(SpeechConstant.ACCENT, "mandarin");
    // 制定語音視頻web前端點:靜音超一直間,院校ms,即用戶的幾個小時時間不會說話溝通則說成超時處置
    //取值時間范圍{1000~10000}
    mIat.setParameter(SpeechConstant.VAD_BOS, "4000");
    //設備微信語音后面點:后面點靜音測量精力,的單位ms,即使用者停下言語多久精力內即感覺就不再讀取, 
    //自己為止手機錄音,規模{0~10000}
    mIat.setParameter(SpeechConstant.VAD_EOS, "1000");
    //裝置標點點符號,裝置為"0"取到最終無標點,裝置為"1"取到最終有標點
    mIat.setParameter(SpeechConstant.ASR_PTT,"1");
    
    //開始自動識別,并設為監聽器器
    mIat.startListening(mRecogListener);
    
    # 2.2.6.2、帶UI識別
    // 默認值化聽寫Dialog,若只動用有UI聽寫技能,不要創立了SpeechRecognizer
    // 運用UI聽寫用途,請會根據sdkzip文件夾導航下的notice.txt,置放平面布置zip文件夾和照片網絡資源
    mIatDialog = new RecognizerDialog(IatDemo.this, mInitListener);
    
    //以上為dialog設立聽寫技術參數
    mIatDialog.setParams("xxx","xxx");
    ....
    
    //開啟設別并軟件設置監聽器器
    mIatDialog.setListener(mRecognizerDialogListener);
    //顯視聽寫對活框
    mIatDialog.show();
    

    # 2.3、個性化熱詞設置

    無論是在哪是一種語種中,多種的水果單詞或字(word),或多或是少,總要有相類似的發聲(pronounce)。特別在對外語文中,這款現像更常見,如當一家人說 /zhang/ /s[h]an/ 時,匹配的成語的組成部分,可以是 {張,章,彰,...} {三,姍,珊,...},某些文本框的樂隊組合,在對外語文的好習慣中發現次數最多的,然而是“張三”了。 而在聽寫跳回導致時,會整合內外文,把每天的日子中,有幀率最多的字詞跳回給的服務端。于是,假如企業具體上如果想的導致并是不有幀率最多的字詞,如前文中企業具體上要的是“張姍”——這么的具體時候在手機號建立通訊錄短信中經常性會有,此情此景聽寫導致就是不企業如果想的。各種具體時候下,企業是可以可以通過導出獨特性設計化熱搜詞的原則,不斷添加熱搜詞的辨別的權重計算,想要準備的這類獨特性設計化短信不過是不斷添加響應詞條的辨別的率,但并是不絲毫的。 簡約化網絡熱搜詞可分成:軟件級網絡熱搜詞和用戶的級網絡熱搜詞。 觀眾級流行詞:在軟件代碼中傳到圖片的叫觀眾級流行詞(參照 文檔文件中 SpeechRecognizer 類的 updateLexicon 變量說明,demo里頭有著 代碼舉例),觀眾級流行詞只對傳到圖片流行詞的某些觀眾(系統)中止,正常傳到圖片后10秒鐘身邊中止,直接影響的范圍內是,現階段 APPID 應該用的現階段系統——即指定應該用,各種不同的系統里傳到圖片的流行詞互不打擾;指定系統,各種不同的APPID的應該用傳到圖片的流行詞互不打擾。 適用級網絡熱搜詞:在網頁上上批量下載視頻的是適用級網絡熱搜詞(訊飛開花渠道官站——特色化網絡熱搜詞軟件設置),批量下載視頻后1-2半小時后開始執行,適用級網絡熱搜詞是對大多數運營你適用的儀器都開始執行,游戲更新給目前APPID的大多數選擇儀器。
    mAsr.setParameter( SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD );
    
    // lexiconName 為英語英語詞典名子,lexiconContents 為英語英語詞典信息,lexiconListener 為調整記錄器
    ret = mAsr.updateLexicon( lexiconName, lexiconContents, lexiconListener );
    

    注:個性化熱詞僅支持中文,不支持數字和英文及其他小語種。

    # 2.4、代理服務器設置方法

    在createUtility數據接口的params產品參數中加上:
    net_type=custom, proxy_ip=<host>, proxy_port=<port>
    其中,<host>,<port>替換為實際的代理服務器地址和端口。
    
    舉例子:SpeechUtility.createUtility(context, SpeechConstant.APPID + “=12345678” + “,” + “net_type=custom, proxy_ip=192.168.1.2, proxy_port=8080”); 特別注意:各基本參數間,以英文翻譯分號分縫。
    端口伴演: public static SpeechUtility createUtility(Context context, java.lang.String params)

    注意: 若在設置代理參數后,使用語音服務過程中,報錯10204/10205/10212等網絡異常錯誤時,請查閱以下內容,做出相關操作:

    • 訊飛語音SDK的通信協議使用的是標準HTTP1.1協議,其代理協議使用的是標準HTTP代理協議。
    • 代理服務器需要支持全雙工多問多答方式,即 pipeline 模式。
    • 代理服務器不能對80端口做限制,不能對如下域名做攔截: hdns.openspeech.cn scs.openspeech.cn open.xf-yun.com dev.voicecloud.cn
    • 需要確保代理服務器只負責轉發數據包,不能改變數據包的完整性和時序性。
    • 代理服務器在轉發數據包時,不能在HTTP協議頭部添加 IE6 標識頭。

    # 3、參數說明

    # 3.1、識別結果

    JSON字段 英文全稱 類型 說明
    sn sentence number 第幾句
    ls last sentence boolean 是否最后一句
    bg begin number 保留字段,無需關注
    ed end number 保留字段,無需關注
    ws words array
    cw chinese word array 中文分詞
    w word string 單字
    sc score number 分數
    聽寫最后舉例:
    {
        "sn": 1,
        "ls": true,
        "bg": 0,
        "ed": 0,
        "ws": [
            {
                "bg": 0,
                "cw": [
                    {
                        "w": "昨天",
                        "sc": 0
                    }
                ]
            },
            {
                "bg": 0,
                "cw": [
                    {
                        "w": "的",
                        "sc": 0
                    }
                ]
            },
            {
                "bg": 0,
                "cw": [
                    {
                        "w": "的天氣",
                        "sc": 0
                    }
                ]
            },
            {
                "bg": 0,
                "cw": [
                    {
                        "w": "怎摸樣",
                        "sc": 0
                    }
                ]
            },
            {
                "bg": 0,
                "cw": [
                    {
                        "w": "。",
                        "sc": 0
                    }
                ]
            }
        ]
    }
    
    多得票數效果范本:
    {
        "sn": 1,
        "ls": false,
        "bg": 0,
        "ed": 0,
        "ws": [
            {
                "bg": 0,
                "cw": [
                    {
                        "w": "我想要聽",
                        "sc": 0
                    }
                ]
            },
            {
                "bg": 0,
                "cw": [
                    {
                        "w": "拉德斯基開展曲",
                        "sc": 0
                    },
                    {
                        "w": "拉得斯進行曲",
                        "sc": 0
                    }
                ]
            }
        ]
    }
    

    # 3.2、動態修正

    • 未開啟動態修正:實時返回識別結果,每次返回的結果都是對之前結果的追加;
    • 開啟動態修正:實時返回識別結果,每次返回的結果有可能是對之前結果的的追加,也有可能是要替換之前某次返回的結果(即修正);
    • 開啟動態修正,相較于未開啟,返回結果的顆粒度更小,視覺沖擊效果更佳;
    • 使用動態修正功能需到控制臺-流式聽寫-高級功能處點擊開通,并設置相應參數方可使用,參數設置方法:mIat.setParameter("dwa", "wpgs"); ;
    • 動態修正功能僅 中文 支持;
    • 未開啟與開啟返回的結果格式不同,詳見下方;

    若開通了動態修正功能并設置了dwa=wpgs(僅中文支持),會有如下字段返回:

    參數 類型 描述
    pgs string 開啟wpgs會有此字段
    取值為 "apd"時表示該片結果是追加到前面的最終結果;取值為"rpl" 時表示替換前面的部分結果,替換范圍為rg字段
    rg array 替換范圍,開啟wpgs會有此字段
    假設值為[2,5],則代表要替換的是第2次到第5次返回的結果
    動態的修改加載最后辨析代碼是什么舉例:
    // 讀入信息步長返回了結果樣例二維碼
    private void printResult(RecognizerResult results) {
        String text = JsonParser.parseIatResult(results.getResultString());
    
        String sn = null;
        String pgs = null;
        String rg = null;
        // 調用json結果顯示中的sn字符
        try {
            JSONObject resultJson = new JSONObject(results.getResultString());
            sn = resultJson.optString("sn");
            pgs = resultJson.optString("pgs");
            rg = resultJson.optString("rg");
        } catch (JSONException e) {
            e.printStackTrace();
        }
        //如pgs是rpl就在某個的可是中卸載掉要擴大的sn方面
        if (pgs.equals("rpl")) {
            String[] strings = rg.replace("[", "").replace("]", "").split(",");
            int begin = Integer.parseInt(strings[0]);
            int end = Integer.parseInt(strings[1]);
            for (int i = begin; i <= end; i++) {
                mIatResults.remove(i+"");
            }
        }
        
        mIatResults.put(sn, text);
        StringBuffer resultBuffer = new StringBuffer();
        for (String key : mIatResults.keySet()) {
            resultBuffer.append(mIatResults.get(key));
        }
    
        mResultText.setText(resultBuffer.toString());
        mResultText.setSelection(mResultText.length());
    }
    
    加載導致樣例: "rpl":替換成 樣例
    {
      "sn": 2,
      "ls": false,
      "bg": 0,
      "ed": 0,
      "pgs": "rpl",
      "rg": [
        1,
        1
      ],
      "ws": [
        {
          "bg": 0,
          "cw": [
            {
              "sc": 0.00,
              "w": "我"
            }
          ]
        },
        {
          "bg": 0,
          "cw": [
            {
              "sc": 0.00,
              "w": "的"
            }
          ]
        },
        {
          "bg": 0,
          "cw": [
            {
              "sc": 0.00,
              "w": "兩"
            }
          ]
        },
        {
          "bg": 0,
          "cw": [
            {
              "sc": 0.00,
              "w": "個"
            }
          ]
        },
        {
          "bg": 0,
          "cw": [
            {
              "sc": 0.00,
              "w": "手機短信"
            }
          ]
        }
      ]
    }
    
    "apd":追加 范例
    {
      "sn": 3,
      "ls": false,
      "bg": 0,
      "ed": 0,
      "pgs": "apd",
      "ws": [
        {
          "bg": 0,
          "cw": [
            {
              "sc": 0.00,
              "w": ","
            }
          ]
        },
        {
          "bg": 0,
          "cw": [
            {
              "sc": 0.00,
              "w": "昨日"
            }
          ]
        },
        {
          "bg": 0,
          "cw": [
            {
              "sc": 0.00,
              "w": "中午"
            }
          ]
        }
      ]
    }
    

    # 4、視頻教程

    # 5、常見問題

    # 目前安卓平臺具體支持安卓版本

    答:Android游戲版本的SDK現今搭載4.4之上游戲版本的,React-Native ,QT 等跨機構預案,現今暫不搭載

    # 集成語音識別功能時,程序啟動后沒反應

    答:請查要不要我忘了應用SpeechUtility初始狀態化。也能否在記錄器的onError變量中印刷差錯資料資料,結合資料系統提示,尋找差錯資料源。

    # SDK是否支持本地語音能力?

    答:Android軟件SDK都已經支持系統地方生成、地方強制性詞掌握、地方音頻喚起功能性了,加入使用后前去使用保持臺資源下載各服務項目sdk時需。

    # 獲取到語音聽寫結果為空或錯誤內容或者內容不全的原因是什么?

    答:原因可能是:
    1、音頻格式不正確,客戶端支持的音頻編解碼算法只支持16位Intel PCM格式的音頻,請使用Cool Edit Pro工具(網頁搜索下載即可)查看音頻格式,sdk目前支持的格式是 pcm 和 wav 格式、音頻采樣率要是 16k 或者 8k、采樣精度16 位、單聲道音頻。
    2、引擎的參數設置不正確,如沒有設置好正確的引擎類型和采樣率等。
    3、音頻中間有靜音或者雜音音頻超過了后端點(默認為1800ms)的設置,此時請使用Cool Edit Pro工具查看音頻內容,并且設置后端點(vad_eos)為最大值10000ms
    包含超過后端點最大值的靜音或者雜音音頻識別不完整是正常的。

    # 錯誤碼21001, 21002, 20021, 創建單例返回 null

    答:學習下回貼:http://bbs.teknisi-computer.com/forum.php?mod=viewthread&tid=9688

    # 如何設置識別業務所需的額外參數(其它業務類似)?

    答:如要設制性能對:abc = 123,則應寫:mIat.setParameter("abc", "123"); 四種性能設制考生

    # 如何設置語音网络赚钱平台服務URL?

    答:在createUtility接口中添加:server_url = http://YourDomainName/msp.do (YourDomainName是指語音网络赚钱平台服務域名,請開發者自行替換) 例如:SpeechUtility.createUtility(context, SpeechConstant.APPID + "=12345678" + "," + "server_url = http://sdk.openspeech.cn/msp.do");
    注意:各參數間,以英文逗號分隔。 接口原型: public static SpeechUtility createUtility(Context context, java.lang.String params)

    # SDK形式是否支持多路并發?

    答:sdk:顧客端防止計劃書,能夠Android、ios、windows、linux等機構,不能夠連接數; webapi:的服務端防止計劃書,不限止機構、不限止言語,能夠連接數。

    # 語音聽寫支持識別多長時間的音頻,支持的音頻格式是什么?

    答:語音聽寫的功能是可以識別60S以內的短音頻,將音頻轉化成文本信息。
    聽寫sdk目前支持的格式是 pcm 和 wav 格式、音頻采樣率要是 16k 或者 8k、采樣精度16 位、單聲道音頻。請使用cool edit軟件(網頁搜索下載此軟件即可)查看音頻格式是否滿足相應的識別引擎類型,否則識別為空或者識別為錯誤文本,格式必須正確,除上述格式均不識別,音頻格式一定要滿足要求。現語音聽寫WebAPI接口的中文普通話和英文支持mp3格式,如有需要,請參考語音聽寫(流式版)WebAPI (opens new window)
    具體可以參考:http://bbs.teknisi-computer.com/forum.php?mod=viewthread&tid=7051
    另外我們識別的音頻長度最大為 60S,在使用音頻是要注意你的本地音頻的參數要和代碼里的讀取音頻參數保持一致

    # 安卓聽寫sdk如何下載?

    答:文檔中心---快速指引 (opens new window)有介紹步驟---根據步驟下載安卓在線聽寫sdk

    # 聽寫識別結果如何顯示阿拉伯數字?

    答:設立nunum=1即刻優先權取到阿拉伯數字5。

    # 為什么使用音頻文件返回結果為空、音頻文件識別不完整?

    答:雙聲道文件格試歪斜確或者是雙聲道文件格試與使用的技術參數不自動匹配。

    # 為什么保存的本地錄音無法播放?

    答:同步保存的雙聲道視頻文件類型為pcm文件類型的雙聲道視頻,是未能就直接觀看的,可下載百度下來了在使用cool edit pro實現觀看。

    # 聽寫會識別手機發出的聲音,如何屏蔽手機聲音?

    答:設置成mIse.setParameter("KEY_REQUEST_FOCUS", "true");就可以了撤銷華為手機雜聲。

    # 如何設置返回結果不打印標點符號?

    答:ASR_PTT顯示能否返回了標點標記,借助此參數表,設施聽寫備份文本報告單能否含標點標記。0顯示不用標點,1則顯示帶標點。

    # 最多支持多少熱詞,是否可以擴容?

    答:調控臺多蘋果適用2000個網絡熱詞,暫不蘋果適用實現擴容。

    # 是否支持x86架構?

    答:現今不支撐x86組織架構。
    日赚300的网络兼职 趣闲赚app persistentfrontiers.comambrosiachocolatemaker.comweb20office.com