top of page

AI coding與配音 實現雙語有聲書

JLMS_Jenny

幾個月前某天意外發現一位在台北某國際學校任職的法國朋友很會說故事。

一句玩笑話:「我學過配音,你很會說故事。我們好像可以來一個中法雙語有聲書。」

一方面能幫助在台日益增多的台法雙語家庭小孩,另一方面,純粹覺得學了一個技能可以自己找舞台使用。


才說完要自己配音,腦中也出現另一個聲音:

「是否太蠢,AI語音都有很多可能了,我還在配音。」


最後說服自己的原因是:孩子聽故事書需要很滿的情緒價值以及聲音表情,這目前語音生成還沒有這個效果。還是靠自己在麥克風前瘋瘋癲癲才能展現這麼多的聲音表情。


於是這個神來一筆的計畫就再利用「撿零碎時間」的情況下開始了

我的理想步驟:

1.找故事 (國際學校有很多教材)

2.改寫成中法雙語對話腳本 (避開版權問題)

3.配音 (幫自己的配音學習找舞台)

4.剪輯 (過去剪過三年影片,現在剪聲音檔不難)

5.完成



--------------------------------------------------------------

第一步驟:故事來源

在國際學校服務的老師,得到了同事們的幫助,從學校拿到了很多兒童法語故事書教材。

他將十多本故事書一一掃描給我。

收到掃描來的15本教材有幾個特色,


  1. 全是PDF檔案,掃描時有些畫面動到、光線不勻。

  2. 每一本故事書約15-17頁。

  3. 同一頁中描述相同的故事情節,並分成三個區塊,分別標上:petits (給小小朋友)、moyens(給年紀大一點點的)以及grands段落,是語言複雜度更高、法文語法用字更難、場景描述更豐富,給年紀更大,約7歲的小孩。 

經討論後,我們腳本只需要根據grands的內容編寫成雙語腳本即可。


第二步驟:腳本改寫

我第一直覺是:上傳檔案,請GPT篩選每一頁中標示「grands區塊」的故事內容,彙整後,請GPT改寫成雙語有聲書腳本就好了!


當我上傳後,問題來了:


問題1. GPT表示「一些技術問題,導致我無法提取圖片中的文字。建議使用可以進行OCR(光學字符識別)的軟件,例如 Adobe Acrobat 或 Google Docs,將圖片轉換成文字,然後分享文字內容給我。」


問題2. 我按照GPT指示,轉成google doc檔後,但檔案中的文字顏色、大小、字型、行距都不一樣。非常凌亂難以閱讀。


問題3. 如果只有一個文件就算了,但是我故事十幾本,代表有十幾個這樣格式、字型混亂的google doc檔。而且,我一個個用google doc開啟轉檔,會非常耗費時。


整了一下現況,就算都變成google doc檔,目前資料太無規則可言,GPT也無法幫我寫腳本。


思考後,最終我決定ai coding,讓以下步驟自動化,將檔案整理乾淨,以利後續腳本生成:


  1. 把將近20份PDF檔自動存成文字檔。(PDF檔用google doc一份份開啟也可以,但用app script可以讓他五秒內十幾份PDF直接存成google doc文字檔)


  2. 接著將篩選出來的文字整理成大小、字型、顏色、行距段落相同。


  3. 並把文件中的petits、moyens、grands這個對我來說是區分段落的關鍵字標註成紅色。這個動作純粹以利後續找規則寫下指令,讓「grands區塊」的故事內容可以被自動篩選出來。


這幾個步驟都完成後,我也終於看懂google doc文字檔裡面的一些規律。依循規律下了指令,得到最後一個步驟的程式碼,執行後順利得到「grands區塊」的故事內容。


完成這個步驟後,我只要再丟回GPT,告訴他我的需求、腳本概念(法文旁白、中文配音),請他根據故事內容改編成雙語有聲書腳本就好了。


這個有聲書的腳本,最後一個功能是:根據腳本給我一張16:9 YouTube封面圖。

因為腳本很多細節,所以根據腳本生成圖也非常符合故事情節(如果真的遇到小細節自己看不下去,就會用photoshop簡單修圖)

右上圖是原版教材,我只需要第三個區塊的文字即可
右上圖是原版教材,我只需要第三個區塊的文字即可



--------以上腳本生成步驟我盡量自動化。以下要完成的步驟,非常需要生命經驗的累積--------


「玩聲音」

有了腳本,接下來就是「玩聲音」。

聲音傳遞的訊息量太多,如果只透過生成,會少掉很多生命力。

對於不到七歲的孩子來說,聲音展現的訊息量可以開啟他們的想像力、讓他們感受到與配音者的連結。基於以上這種很「有溫度」的原因,我和法國朋友用「玩」的心情錄製這些有聲書。

大概也是是著實現了學配音時說的:自己創造平台玩聲音。


錄製時,因為一人分飾太多角(熊爸、熊媽、小熊、小女孩、烏鴉、狐狸、老師、大野狼…),就要開始回想身旁不同角色、不同個性、不同身型的人的聲音,如果是動物,是大野狼、烏鴉講中文…

這需要反芻生命經驗、考驗平日對生活周遭的觀察和無聊時喜歡模仿人講話的機車性格,現在聲音展現能力還是很有限,但這種能力只能繼續觀察、累積、模仿、練習...

好好過生活的重要性XD


後製時,背景音樂的選擇也會牽動著聽者情緒。

有時候還沒加音樂,但腦中已經有音樂調性的想法。

沒有靈感時,只能在音樂庫平台一首首點來聽,一切都很看點選音樂當下帶給內心那種可意會不可言傳的感受。

如果聽到一些旋律,靈光乍現,畫面跟音樂搭配得上時,都會很感謝國中在光仁時不時被拉去大禮堂聽音樂會、音樂課老師很執著音樂賞析這件事…(當年都不懂這件事到底多重要…)


-------------------------

這個雙語有聲書,雖然只上傳了三集,但幾乎每天都會收到各方的正面回饋。

國際學校的老師甚至把他變成教材,要孩子在聽完故事後劃下他們腦中的畫面。面對四歲的孩子,聽有聲書是讓他們靜下心來的一個手段。

這個臨時起意的計畫,起初只單純希望能幫助到雙語家庭的孩子們。

但也因為這麼臨時起意,所以希望可以在實現這個計畫時,同時練習、實踐其他學習到的技能,才不會太浪費時間、浪費錢的感覺。


意外的是,因為這個有聲書而有機會認識一些有趣的人、得到一些有趣的機會及可能。

雖然開始的動機單純好玩,單純覺得可能對孩子們有幫助,但最終最大受益者,還是自己。



Recent Posts

See All

Comments


bottom of page