网络赚钱平台

    # 語音轉寫 API 文檔

    # 接口說明

    語音轉寫(Long Form ASR)基于深度全序列卷積神經網絡,將長段音頻(5小時以內)數據轉換成文本數據,為信息處理和數據挖掘提供基礎。

    轉寫的是已錄制音頻(非實時),音頻文件上傳成功后進入等待隊列,待轉寫成功后用戶即可獲取結果,返回結果時間受音頻時長以及排隊任務量的影響。 如遇轉寫耗時比平時延長,大概率表示當前時間段出現轉寫高峰,請耐心等待即可,我們承諾有效任務耗時最大不超過5小時,詳情請參考SLA協議 (opens new window)
    另外,為使轉寫服務更加通暢,請盡量轉寫5分鐘以上的音頻文件,上傳大量的短音頻易引起網絡和服務器資源緊張,從而導致任務排隊積壓。

    該接口是通過REST API的方式給開發者提供一個通用的HTTP接口,基于該接口,開發者可以獲取開放平臺的語音轉寫能力,方便開發者使用自己熟悉的編程語言快速集成。

    音頻時長與理論返回時間可以參考下表(請注意,實際返回時長受上傳的音頻時長和任務總量影響,忙時會出現任務排隊情況):

    音頻時長X(分鐘) 參考返回時間Y(分鐘)
    X<10 Y<3
    10<=X<30 3<=Y<6
    30<=X<60 6<=Y<10
    60<=X 10<=Y<20

    # 接口Demo

    示例demo請點擊 這里 下載。
    目前僅提供部分開發語言的demo,其他語言請參照下方接口文檔進行開發。
    也歡迎熱心的開發者到 分享你們的demo。

    # 接口要求

    模塊化語言轉寫API時,需可以依照一下規定要求。
    內容 說明
    請求協議 http[s](為提高安全性,強烈推薦https)
    請求地址 http[s]: //raasr.teknisi-computer.com/api/xxx
    注:服務器IP不固定,為保證您的接口穩定,請勿通過指定IP的方式調用接口,使用域名方式調用
    請求方式 POST
    接口鑒權 簽名機制,詳見下方[2、文件分片上傳接口]
    字符編碼 UTF-8
    響應格式 統一采用JSON格式
    開發語言 任意,只要可以向訊飛网络赚钱平台服務發起HTTP請求的均可
    音頻屬性 采樣率16k或8k、位長8bit或16bit、單聲道&多聲道
    音頻格式 wav/flac/opus/m4a/mp3
    音頻大小 不超過500M
    音頻時長 不超過5小時,建議5分鐘以上
    語言種類 中文普通話、英文,小語種以及中文方言可以到控制臺-語音轉寫-方言/語種處添加試用或購買
    轉寫結果保存時長 30天
    獲取結果次數 不得超過100次
    SLA保障時長 返回時長最大不超過5小時,賠償標準等詳情請參考SLA協議 (opens new window)

    # 接口調用流程

    轉寫 API 也包括左右插口: 預整理、 壓縮文件下載按片傳到、 一并壓縮文件下載、 查尋整理學習進度、 獲利畢竟。
    • 預處理 /prepare:
    • 文件分片上傳 /upload:
    • 合并文件 /merge:
    • 查詢處理進度 /getProgress:
    • 獲取結果 /getResult:

    轉寫流程圖

    通用型反回說明書:
    參數 類型 說明
    ok int 調用成功標志(0:成功,-1:失敗)
    err_no int 錯誤碼,詳見附錄錯誤碼
    failed string 錯誤描述(null:未出錯)
    data string 數據,具體含義見各接口返回說明(null:無返回值)
    task_id string 任務id,此字段只在主動回調的結果中存在

    # 1、預處理接口

    # 概述

    	首先調用預處理接口,上傳待轉寫音頻文件的基本信息(文件名、大小)和分片信息(建議分片大小設置為10M,若無需分片,slice_num=1)和相關的可配置參數。
    	調用成功,返回任務ID(task_id,轉寫任務的唯一標識),是后續接口的必傳參數。
    

    # URL

    	POST  http[s]://raasr.teknisi-computer.com/api/prepare
    

    # 請求頭

    	Content-Type: application/x-www-form-urlencoded; charset=UTF-8
    

    # 參數說明

    參數 類型 必須 說明 示例
    app_id string 訊飛開放平臺應用ID 595f23df
    signa string 加密數字簽名(基于HMACSHA1算法,可參考實時轉寫生成方式或頁面下方demo) BFQEcN3SgZNC4eECvq0LFUPVHvI=
    ts string 當前時間戳,從1970年1月1日0點0分0秒開始到現在的秒數 1512041814
    file_len string 文件大小(單位:字節) 160044
    file_name string 文件名稱(帶后綴) lfasr_audio.wav
    slice_num int 文件分片數目(建議分片大小為10M,若文件<10M,則slice_num=1) 1
    lfasr_type string 轉寫類型,默認 0
    0: (標準版,格式: wav,flac,opus,mp3,m4a)
    2: (電話版,已取消)
    0
    has_participle string 轉寫結果是否包含分詞信息 false或true, 默認false
    max_alternatives string 轉寫結果中最大的候選詞個數 默認:0,最大不超過5
    eng_vad_margin int 首尾是否帶靜音信息,不帶靜音信息可以使得詞相對于本句子的起始幀更精確
    0:不顯示
    1:顯示
    默認為 1,帶靜音信息
    has_smooth string 開啟或關閉順滑詞(目前只有中文、英文支持順滑詞,其他方言和小語種暫不支持順滑詞,也不支持順滑詞的關閉)
    開啟:true
    關閉:false
    默認:true(開啟順滑詞)
    track_mode string 聲道分軌轉寫模式,可選值:1,2
    1: 表示不分軌
    2: 表示分軌
    :此功能適用于雙聲道音頻發音人分離場景,要求雙聲道音頻每個聲道是獨立發音人,開啟該功能后,參數speaker_number失效
    默認:1(適用通話時兩個人對話的場景)
    speaker_number string 發音人個數,可選值:0-10,0表示盲分
    :發音人分離目前還是測試效果達不到商用標準,如測試無法滿足您的需求,請慎用該功能。
    默認:2(適用通話時兩個人對話的場景)
    has_seperate string 轉寫結果中是否包含發音人分離信息 false或true,默認為false
    role_type string 支持參數如下
    1: 通用角色分離
    該字段只有在開通了角色分離功能的前提下才會生效,正確傳入該參數后角色分離效果會有所提升。 如果該字段不傳,默認采用 1 類型
    language string 語種
    cn:中英文&中文(默認)
    en:英文(英文不支持熱詞)
    其他小語種:可到控制臺-語音轉寫-方言/語種處添加試用或購買,添加后會顯示該小語種參數值。若未授權,使用將會報錯26607。
    cn
    eng_rlang string 控制廣東話(粵語)返回的文本結果為繁體還是簡體
    簡體:0
    繁體:1
    默認:1(返回繁體文本)
    pd string 垂直領域個性化參數:
    法院: court
    教育: edu
    金融: finance
    醫療: medical
    科技: tech
    體育: sport
    政府: gov
    游戲: game
    電商: ecom
    汽車: car
    設置示例:prepareParam.put("pd", "edu")
    pd為非必須設置參數,不設置參數默認為通用
    hotWord string 會話級熱詞(使用此參數后appid對應控制臺熱詞不生效)用以提升專業詞匯的識別率,注意點如下:
    1、單個熱詞設置:熱詞
    2、多個熱詞設置:熱詞1|熱詞2|熱詞3
    3、單個熱詞長度不得大于16
    4、熱詞個數限制200個
    設置示例
    1、prepareParam.put("hotWord", "梁育生")
    2、prepareParam.put("hotWord", "梁育生|開心")

    注:

    	標準版和電話版本的已經合并,現在購買的都是標準版的訂單,lfasr_type傳0即可;
    	發音人分離可通過"has_seperate=true"和"speaker_number=個數"來配置。
    

    # 返回值

    順利
    {
        "ok":0,
        "err_no":0,
        "failed":null,
        "data":"383e72a47557490aa05a344074117a9d"
    }
    
    挫敗
    {
        "ok":-1,
        "err_no":26601,
        "failed":"超范圍適用信心",
        "data":null
    }
    

    # 結果說明

    傳參成功失敗,data就是指taskId(作業ID),是之后的主板接口的必傳運作。

    # 2、文件分片上傳接口

    # 概述

    	預處理成功,調用文件上傳接口;
    	按預處理設置的分片信息(slice_num)依次上傳音頻切片(文件以二進制方式讀取上傳),直到全部切片上傳成功(如預處理時 slice_num=2,則需將音頻切分成兩部分,slice_id=aaaaaaaaaa和aaaaaaaaab,并按順序調用該接口);
    	上一切片成功上傳,才可進行下一切片的上傳操作。調用過程中若出現異常,可重試若干次。
    

    # url

    	POST  http[s]://raasr.teknisi-computer.com/api/upload
    

    # 請求頭

    	Content-Type: multipart/form-data;
    

    # 參數說明

    參數 類型 必須 說明 示例
    app_id string 訊飛開放平臺應用ID 595f23df
    signa string 加密數字簽名,詳見下方 BFQEcN3SgZNC4eECvq0LFUPVHvI=
    ts string 時間戳 1512041814
    task_id string 任務ID(預處理接口返回值) 4b705edda27a4140b31b462df0033cfa
    slice_id string 分片序號 aaaaaaaaaa,aaaaaaaaab
    content 字節數組 分片文件內容

    # signa生成

    ① 讀取baseString
    	baseString由appid和當前時間戳ts拼接而成;
    	假如appid = 595f23df,ts = 1512041814,則baseString = 595f23df1512041814
    
    ② 對baseString確定MD5
    	假如baseString為上一步生成的595f23df1512041814,MD5之后則為 0829d4012497c14a30e7e72aeebe565e
    
    ③ 以secret key為key對MD5此后的baseString使用HmacSHA1讀取,再再對讀取后的空c語言字符串使用base64商品編號。
    	假如secretkey = d9f4aa7ea6d94faca62cd88a28fd5234,
    	MD5之后的baseString為上一步生成的0829d4012497c14a30e7e72aeebe565e,
    	則HmacSHA1加密之后再進行base64編碼得到的signa為: IrrzsJeOFk1NGfJHW6SkHUoN9CU=
    
    提示:
    • secretkey:接口密鑰,在應用中添加語音轉寫服務后,顯示在服務管理頁面,請調用方注意保管;
    • signa的生成公式:HmacSHA1(MD5(appid + ts),secretkey),具體的生成方法詳見【調用示例】;

    # 返回值

    實現目標
    {
        "ok":0,
        "err_no":0,
        "failed":null,
        "data":null
    }
    
    故障
    {
        "ok":-1,
        "err_no":26602,
        "failed":"神器任務ID不具備",
        "data":null
    }
    

    # slice_id生成代碼(python)示例

    class SliceIdGenerator:
        """slice id繪制器"""
        def __init__(self):
            self.__ch = 'aaaaaaaaa`'
    
        def getNextSliceId(self):
            ch = self.__ch
            j = len(ch) - 1
            while j >= 0:
                cj = ch[j]
                if cj != 'z':
                    ch = ch[:j] + chr(ord(cj) + 1) + ch[j+1:]
                    break
                else:
                    ch = ch[:j] + 'a' + ch[j+1:]
                    j = j -1
            self.__ch = ch
            return self.__ch
    

    注:每種轉寫目標上傳文件起前有個是一個SliceIdGenerator,利用分塊的先后先后傳參getNextSliceId轉為代表的slice_id

    # 3、合并文件接口

    # 概述

    	全部文件切片上傳成功后,調用該接口,通知服務端進行文件合并與轉寫操作。
    	該接口不會返回轉寫結果,而是通知服務端將任務列入轉寫計劃。轉寫的結果通過 getResult 接口獲取。
    

    # url

    	POST  http[s]://raasr.teknisi-computer.com/api/merge
    

    # 請求頭

    	Content-Type: application/x-www-form-urlencoded; charset=UTF-8
    

    # 參數說明

    參數 類型 必須 說明 示例
    app_id string 訊飛開放平臺應用ID 595f23df
    signa string 加密數字簽名 BFQEcN3SgZNC4eECvq0LFUPVHvI=
    ts string 時間戳 1512041814
    task_id string 任務ID(預處理接口返回值) 4b705edda27a4140b31b462df0033cfa

    # 返回值

    成功率
    {
        "ok":0,
        "err_no":0,
        "failed":null,
        "data":null
    }
    
    無法
    {
        "ok":-1,
        "err_no":26602,
        "failed":"的任務ID不存有",
        "data":null
    }
    

    # 4、查詢處理進度接口

    # 概述

    	在調用方發出合并文件請求后,服務端已將任務列入計劃。在獲取結果前,調用方需輪詢該接口查詢任務當前狀態。
    	當且僅當任務狀態=9(轉寫結果上傳完成),才可調用獲取結果接口獲取轉寫結果。
    	輪詢策略由調用方決定,建議每隔10分鐘輪詢一次。狀態碼說明見附錄。
    

    # url

    	POST  http[s]://raasr.teknisi-computer.com/api/getProgress
    

    # 請求頭

    	Content-Type: application/x-www-form-urlencoded; charset=UTF-8
    

    # 參數說明

    參數 類型 必須 說明 示例
    app_id string 訊飛開放平臺應用ID 595f23df
    signa string 加密數字簽名 BFQEcN3SgZNC4eECvq0LFUPVHvI=
    ts string 時間戳 1512041814
    task_id string 任務ID(預處理接口返回值) 4b705edda27a4140b31b462df0033cfa

    # 返回值

    順利完成
    {
        "ok":0,
        "err_no":0,
        "failed":null,
        "data":"{\"desc\":\"重任組建成就\",\"status\":0}"
    }
    
    失敗的
    {
        "ok":-1,
        "err_no":26640,
        "failed":"文件目錄上傳文件失敗的",
        "data":null
    }
    

    # 處理流程

    轉寫-查詢處理進度流程圖

    # 5、獲取結果接口

    # 概述

    	當任務處理進度狀態=9(見查詢處理進度接口),調用該接口獲取轉寫結果。這是轉寫流程的最后一步。
    	轉寫結果各字段的詳細說明見轉寫結果說明文檔。
    	服務端也支持主動回調,轉寫完成之后主動發送轉寫結果到用戶配置的回調地址,配置回調地址請聯系技術支持。
    

    # url

    	POST  http[s]://raasr.teknisi-computer.com/api/getResult
    

    # 請求頭

    	Content-Type: application/x-www-form-urlencoded; charset=UTF-8
    

    # 參數說明

    參數 類型 必須 說明 示例
    app_id string 訊飛開放平臺應用ID 595f23df
    signa string 加密數字簽名 BFQEcN3SgZNC4eECvq0LFUPVHvI=
    ts string 時間戳 1512041814
    task_id string 任務ID(預處理接口返回值) 4b705edda27a4140b31b462df0033cfa

    # 返回值

    順利
    {
        "ok":0,
        "err_no":0,
        "failed":null,
        "data":"[{\"bg\":\"0\",\"ed\":\"4950\",\"onebest\":\"科大訊飛是全國的智力音頻能力給出商。\",\"speaker\":\"0\"}]"
    }
    
    出現未知錯誤
    {
        "ok":-1,
        "err_no":26601,
        "failed":"違反規定選用數據",
        "data":null
    }
    

    # 附錄

    # 轉寫結果字段說明

    字段名 說明
    bg 句子相對于本音頻的起始時間,單位為ms
    ed 句子相對于本音頻的終止時間,單位為ms
    onebest 句子內容
    speaker 說話人編號,從1開始,未開啟說話人分離時speaker都為0
    si 句子標識,相同si表示同一句話,從0開始
    注:僅開啟分詞或者多候選時返回
    wordsResultList 分詞列表
    注:僅開啟分詞或者多候選時返回
    alternativeList 多候選列表,按置信度排名
    注:僅開啟分詞或者多候選時返回
    wordBg 詞的起始幀,對于本句子的起始幀,其中一幀是10ms
    注:僅開啟分詞或者多候選時返回
    wordEd 詞的終止幀,對于本句子的起始幀,其中一幀是10ms
    注:僅開啟分詞或者多候選時返回
    wordsName 詞內容
    注:僅開啟分詞或者多候選時返回
    wc 句子置信度,范圍為[0,1]
    注:僅開啟分詞或者多候選時返回
    wp 詞屬性,n代表普通詞,r代表人名,d代表數字,m代表量詞,s代表順滑詞(語氣詞),t代表地名&多音字,p代表標點,g代表分段標識
    注:僅開啟分詞或者多候選時返回

    # 錯誤碼

    錯誤碼 錯誤碼描述
    0 成功
    26000 轉寫內部通用錯誤
    26100 轉寫配置文件錯誤
    26101 轉寫配置文件app_id/secret_key為空
    26102 轉寫配置文件lfasr_host錯誤
    26103 轉寫配置文件file_piece_size錯誤
    26104 轉寫配置文件file_piece_size建議設置10M-30M之間
    26105 轉寫配置文件store_path錯誤,或目錄不可讀寫
    26201 轉寫參數上傳文件不能為空或文件不存在
    26202 轉寫參數類型不能為空
    26203 轉寫參數客戶端生成簽名錯誤
    26301 轉寫斷點續傳持久化文件讀寫錯誤
    26302 轉寫斷點續傳文件夾讀寫錯誤
    26303 轉寫恢復斷點續傳流程錯誤,請見日志
    26401 轉寫上傳文件路徑錯誤
    26402 轉寫上傳文件類型不支持錯誤
    26403 轉寫本地文件上傳超過限定大小500M
    26404 轉寫上傳文件讀取錯誤
    26500 HTTP請求失敗
    26501 轉寫獲取版本號接口錯誤
    26502 轉寫預處理接口錯誤
    26503 轉寫上傳文件接口錯誤
    26504 轉寫合并文件接口錯誤
    26505 轉寫獲取進度接口錯誤
    26506 轉寫獲取結果接口錯誤
    26600 轉寫業務通用錯誤
    26601 非法應用信息
    26602 任務ID不存在
    26603 接口訪問頻率受限(默認1秒內不得超過20次)
    26604 獲取結果次數超過限制,最多100次
    26605 任務正在處理中,請稍后重試
    26606 空音頻,請檢查
    26610 請求參數錯誤
    26621 預處理文件大小受限(500M)
    26622 預處理音頻時長受限(5小時)
    26623 預處理音頻格式受限
    26625 預處理服務時長不足。您剩余的可用服務時長不足,請移步產品頁http://teknisi-computer.com/services/lfasr 進行購買或者免費領取
    26631 音頻文件大小受限(500M)
    26632 音頻時長受限(5小時)
    26633 音頻服務時長不足。您剩余的可用服務時長不足,請移步產品頁http://teknisi-computer.com/services/lfasr 進行購買或者免費領
    26634 文件下載失敗
    26635 文件長度校驗失敗
    26640 文件上傳失敗
    26641 上傳分片超過限制
    26642 分片合并失敗
    26643 計算音頻時長失敗,請檢查您的音頻是否加密或者損壞
    26650 音頻格式轉換失敗,請檢查您的音頻是否加密或者損壞
    26660 計費計量失敗
    26670 轉寫結果集解析失敗
    26680 引擎處理階段錯誤
    26607 轉寫語種未授權或已過有效期

    # 任務狀態碼

    狀態ID 狀態描述
    0 任務創建成功
    1 音頻上傳完成
    2 音頻合并完成
    3 音頻轉寫中
    4 轉寫結果處理中
    5 轉寫完成
    9 轉寫結果上傳完成

    # 調用示例

    注:?demo只是一個簡單的調用示例,不適合直接放在復雜多變的生產環境使用

    訊飛發展平臺網站AI本事-JAVASDK: 訊飛開啟軟件平臺AI的能力-PHPSDK:

    # 教學視頻

    # 常見問題

    # 語音轉寫支持哪些音頻格式?

    答:現下微信語音轉寫適用的錄音論文格式為:已錄屏錄音(5幾小時內),wav,flac,opus,m4a,mp3,單聲道&多聲道,適用語種:常常常見話、用英語、開通4g的小語種并且常常家鄉話,采集率:8KHz,16KHz

    # 語音轉寫支不支持并發?

    答:認可,要可以保障一模一樣個appid每秒需求接頭頻繁上限值在20次下述。

    # 語音轉寫可以試用嗎?

    答:能夠領到新用戶數禮券,會按照您實名認證的度,提高一般50小時英文的全免 耗時,可以期限為一年時間。

    # 語音轉寫支持什么語言?

    答:幫助語種:繁體中文版普遍話、英語英文,小語種包括繁體中文版山西各地方言都可以到調整臺-聊天語音轉寫-山西各地方言/語種處放入使用或售賣;設備的方法參考使用作出語文規格切換桌面可以了

    # 語音轉寫的套餐扣費順序是怎樣的?

    答:扣量優先選擇級:兔費測試>文件批處理下單,即在“文件批處理下單”的手機套餐資費內容銀行卡資金余下的癥狀下,又拿到了兔費測試的感覺式包,則拿到的兔費測試感覺式包直接判決書生效,并被添加為在當下扣量手機套餐資費內容。而過后下單的手機套餐資費內容包的銀行卡資金和期滿日保持不變。
    日赚300的网络兼职 趣闲赚app persistentfrontiers.comambrosiachocolatemaker.comweb20office.com