Lark Minutes: 免費的訪談、會議錄影錄音轉逐字稿工具(中英文皆支援)

Lark Minutes: 免費的訪談、會議錄影錄音轉逐字稿工具(中英文皆支援)

image

相信只要做過使用者研究的人都會遇到一個難題:打逐字稿。

逐字稿對於較為嚴謹的使用者研究有一定的必要性,因為訪談當下注意到的東西不一定會在後續分析時用到,一開始沒注意到的細節或洞察有可能要與資料接觸一段時間之後才能夠識別並且挖掘出來,因此逐字稿就是作為儲存完整資料的一種常見方式。

然而依據我的經驗,逐字稿的轉寫大概需要花音檔長度的 3 倍以上時間,也就是一個小時的訪談音檔,會需要非常專注的三小時來完成轉寫。當一個研究專案需要訪談很多位研究參與者,可以想像這會變成研究時程的主要卡點之一。

現有語音轉逐字稿 (Speech to Text) 方案的限制有哪些?

針對此問題,國外早已有一些成熟的方案來解決,例如 Otter.ai 就可以整合會議軟體進行會議逐字稿記錄,當然也可以在訪談情境使用,可惜的是目前都只支援英文。而從有這個需求開始,我就常常問身邊做研究的朋友們都怎麼解決這個問題,也整理出了以下一些常見的解法,例如:

  • 不事後寫逐字稿,而是在訪談當下依靠多位研究人員詳盡的筆記(或邊訪談邊盡可能的打逐字稿)加上訪談後用便利貼立即記下當場訪談聽到的所有重點
  • 在訪談時使用 Google Doc 的語音輸入法把訪談內容實時紀錄成文字
  • 用 Otranscribe 邊播音檔邊打逐字稿,減少切換視窗時間
  • 使用雅婷逐字稿等音檔轉文字軟體付費轉寫
  • 使用開源的逐字稿軟體 pyTranscriber 免費轉寫
  • 大量聘雇外包人員打逐字稿

這個痛點實在是太痛,痛到我願意為此付費,實測過 pyTranscriber 和雅婷逐字稿後卻都大失所望,因為他們的轉寫品質不太符合心中的預期,因此之後我也一直沒興趣嘗試中文的轉寫服務。而聘僱外包人員除了成本更高,也很難確保他們有良好與穩定的翻譯品質,最終還是會有可能要重聽和改動內容,不是一個 CP 值很高的方案。

最簡單易用且免費的逐字稿軟體服務:Lark Minutes

直到我遇到了飛書妙記這個會議工具,才完全解決了這個問題,但我發現臺灣沒有人在討論這個工具,所以才想寫一篇文來分享給大家。

飛書是字節跳動的效率辦公平台,Lark 是他的國際版本,所以台灣人必須註冊 Lark。Lark Minutes / 飛書妙記就是整合在視訊會議功能的一個工具,能夠在會議結束後快速生成「極為精準」的會議逐字稿,也可以在裡面加入一些會議記要。除此之外,妙記也開放上傳音檔或影片,因此就算不用飛書開視訊會議,也可以存檔後再上傳到飛書妙記。

由於飛書 / Lark 是一個協作辦公 SaaS,為了支援上傳足夠量的檔案來讓團隊協作,預設給免費方案的空間已有 100 GB,如果只上傳音檔不拿來做其他使用,基本上不太會需要擔心儲存空間不夠的問題。

Lark Minutes 操作流程

以下就來簡單介紹一下 Lark Minutes 的操作流程。雖然截圖是用飛書妙記,不過流程是一模一樣的。

  1. 註冊後開啟飛書妙記 / Lark Minutes
image
  1. 點擊上傳,可以選從裝置中上傳,如果原本就有用飛書的雲端儲存空間,也可以從雲端硬碟匯入
image
  1. 一般人在講話時會中英文交錯,面對這個場景目前實測中英文都分辨得出來,不用再特別選要翻譯什麼語言
image
  1. 可以一次上傳多個檔案,上傳過程中去做別的事也可以
image
  1. 完成上傳就會進入轉寫的處理,兩個小時的錄音檔大概只要處理 10 分鐘,更短的話當然就更快
image
  1. 處理完成後就可以點開看逐字稿了,Lark 能夠辨識出不同的聲音,進而分成不同的說話人。如果是會議錄影存檔,或是上傳影片,左邊欄位就會出現影片,影片中講到的字句會在右方逐字稿裡出現對應的 highlight
image
  1. 當然翻譯沒辦法 100% 準確,但使用者可以進行手動編輯,另外說話者的身份也是可以新增修改的
image
  1. 如果上傳的是音檔,就只會有逐字稿的部分,可以仔細看翻譯的結果,真的非常準
image
  1. 編輯完之後就可以匯出逐字稿,如果是要進到質性資料分析軟體(如 Dovetail、Atlas.ti 等等)可以直接輸出 TXT 檔,轉成繁體後貼上。如果是要上傳到影音平台做成字幕,當然就是匯出 SRT 檔
image

以上就是對 Lark Minutes / 飛書妙記的簡單介紹。我的論文有 40 多份的訪談,全部都是靠這個服務幫忙產生逐字稿的,在介紹給 Lab 的同學之後,幾乎所有人也都用了它來加速研究時程。當時有一個同學知道竟然有這個服務之後說自己就像已知用火的原始人,不知道大家是不是也這樣覺得呢XD?

image

如果你也覺得這個工具非常好用,記得幫我分享這篇簡單的介紹與教學文讓更多人解決研究中的困擾吧!

Ps. 應該會有人對資料保存與隱私政策有疑慮,我之前也因此有看過 Lark 的 Privacy Policy,抓重點的話,是 GDPR 合規,伺服器在美國,遵循不同國家的隱私保護政策。考量到研究倫理,研究人員也要做好知情同意,嚴格來說研究對象同意才能使用這種服務。

  • If you are an individual from the European Economic Area (“EEA”), the UK, Switzerland or any country which requires notification of the legal bases for processing, our legal bases under the General Data Protection Regulation (“GDPR”) and applicable data protection laws of each such country, for collecting and using your information described above will depend on the particular type of information and the specific context in which we collect it.
  • We maintain servers located in US and your information may be processed on servers located outside of the country where you live. Data protection laws vary among countries, with some providing more protection than others. Regardless of where your information is processed, we apply the same protections described in this policy. When required by applicable law, we will provide an adequate level of protection for your personal data using various means, including where appropriate, relying on a formal decision that a certain country ensures an adequate level of protection for personal data, or complying with Model Contractual Clauses.
  • We will retain your personal data for the length of time needed to fulfill the purposes outlined in this Policy unless a longer retention period is required, for example to comply with legal obligations or requests or for the establishment, exercise or defense of legal claims, or for legitimate businesses purposes, or as provided by law.
  • If you would like to exercise your rights under applicable law, you can submit your request to the email at privacy@larksuite.com with your name, account and a description of your request. Where permissible by law, we may verify your identity. Please allow us a reasonable time to respond to your inquiries and requests.

由於這個頁面會持續更新,完整內容還是請去查看 Privacy Policy 頁面為準。

本文發表時間:2022/10/29

Resource:

  1. Lark 官方網站
  2. Lark Privacy Policy