從邏輯歸納到創作內容生成之數位創新應用:人工智慧產生內容(AIGC)應用發展

王琬昀資深產業分析師
資策會產業情報研究所(MIC)

人工智慧(Artificial Intelligence,以下簡稱AI)是目前最熱門的話題之一,而何謂AI呢?AI是讓系統或電腦設備有模擬人類思考模式、邏輯與行為的能力,且能自行透過數據分析的過程,持續校正、進化。簡言之,AI就是讓電腦盡量像人類一樣思考、執行策略的科技。隨著AI技術快速發展,AI逐漸從過去分析數據以邏輯學習的「分析型AI(Analytical AI)」迭代到能自行創作的「創造型AI(Generative AI)」,AI機器們也開始生成原本不存在的新事物,例如寫詩、繪畫、開發遊戲等,進而掀起新形態的內容生成方式–人工智慧自動生成內容,以下簡稱AIGC(AI Generated Content),以下將介紹讀者認識。

AIGC具體指基於深度學習技術,如大型語言模型(LLM)、生成對抗網絡(GAN)等自主生成、决策來創造全新的文本、圖像、音樂、影片、3D互動內容等各種形式的內容和數據。從內容生產方式的發展歷程來看,可大致分爲PGC(專業生成內容)、UGC(使用者生成內容)、AIGC三大階段。PGC、UGC 分別被產能與品質所限,難以滿足快速成長的數位內容需求,而基於AI的AIGC,使得內容生產的門檻降低、效率明顯提升(可以快速生產大量內容)等,因而被視為下一波引領數位內容產業發展的新生產工具。

AI
資料來源:紅杉資本、a16Z、資策會MIC

AIGC應用場景

目前AIGC在各行業應用多元,按照形式區分可以分爲文本、聲音、圖像、影像及跨形式生成等,以下將分別介紹。

文本生成細分為(1)結構化寫作。可用於小說、新聞、專業學術寫作、小說和新聞等摘要生成等。例如Automated Insights開發的Wordsmith可以自動生成新聞評論文章;(2)非結構性寫作。可用於行銷文案、劇情撰寫等。例如Jasper平台為社群媒體、廣告行銷、部落客等產出標題、文案、腳本、文章等。(3)互動性文本。可應用於客服、遊戲等。例如OpenAI與Latitude推出遊戲AI Dungeon,可根據輸入的動作或對話生成個性化內容。

聲音生成細分為(1)語音克隆。可用於地圖導航。例如百度地圖可根據輸入的聲音,生成專屬導航語音。(2)語音機器人。可用於客服、銷售、培訓等。例如思必馳開發AI呼叫機器人、接聽機器人、培訓機器人等產品。(3)音樂生成。可用於Podcast、電影、遊戲等。例如OpenAI開發MuseNet可利用10種不同樂器聲音生成音樂作品。

圖像生成細分為(1)圖像編輯與融合。可用於設計、電影。例如Google的Deep Dream Generator可上傳圖像並選擇風格生成新圖像。(2) 2D圖像生成3D模型。可用於遊戲、教育、產品測試等。例如NVIDIA的GANverse3D可利用汽車照片生成3D模型,並在NVIDIA Omniverse中行駛。

影像生成細分為(1)畫質增強修復。可用於影像內插(Video Frame interpolation ,VFI)、影像細節強化、老舊影像的修復與上色。例如當虹科技的畫質增強修復技術幫助影像畫質提升。(2)切換影像風格。可用於電影風格轉換、醫學影像成像效果增強。例如騰訊天衍工作室在結直腸內鏡項目中切換影像風格,優化醫學影像視覺效果。(3)動態臉部編輯。可用於AI換臉。例如Akool的faceswap平台拍攝樣本影像便可編輯、替換模特面部。(4)影像內容創作。可用於製作電影預告片、賽事精彩回顧。例如IBM的Watson製作20世紀福克斯的科幻電影《魔詭(Morgan)》的預告片。

跨形式生成細分為(1)文本生成圖像。可用於媒體、娛樂。例如OpenAI的DALL E2可通過輸入文字生成高仿真圖像。(2)文本生成影像。可用於電影、短影像創作。例如Meta的Make-A-Video輸入文本可生成數秒的影像。(3)圖像/影像生成文本。可用於搜索引擎、問答系統。例如Google的MUM模型支持多樣態復雜資訊搜索。(4)文本生成代碼。可用於Copilot。例如OpenAl的Codex模型可將自然語言翻譯成代碼。

AIGC潛在商業模式

根據應用場景及商業化階段,目前AIGC可變現的商業模式分為對企業(To B)及對用戶(To C)。對企業(To B)的商業模式為模型即服務 (MaaS, Model as a Service)註1,鎖定高頻率、大規模生產內容的場景,在企業內部系統的底層平台接入應用程式開發介面(API),爲平台提供客製化模型服務,並按照模型數據適用量計算費用,例如GPT-3註2。用戶端(To C)商業模式分為按產量計費及軟體即服務(SaaS, Software as a Service) 註3訂閱制兩種。內容產出的數量計費部分,例如AI繪畫軟體DALL E 2按照圖像張數收費。SaaS訂閱制則是用戶需每月付費以換取服務,例如ChatGPT Plus等。

結論

儘管AIGC被視為推動數位經濟從Web2走向Web3升級的重要生產力工具,不過隨著逐步拓展與應用後,逐漸發現其同步帶來的負面影響,包含版權、倫理、數據安全等風險。因此如何既能掌握AIGC所帶來的產業機會,又能同步面對其帶來的挑戰,是未來AIGC發展的重要課題。

 

註1:MaaS是英語「Model as a Service」縮寫,亦有人翻譯為「模型即服務」,意指一種雲端運算服務的新型AI商業模式,將AI大模型變成可服務化的產品,使用者內部不需要具備高技術水準的底層設施,只需通過API串接即可使用,降低AI模型的使用門檻,並大幅提高模型使用效率。

註2:生成型預訓練變換模型 3 (英語:Generative Pre-trained Transformer 3,簡稱 GPT-3)是一個自迴歸語言模型,目的是為了使用深度學習生成人類可以理解的自然語言。

註3:SaaS是英語「Software as a Service」縮寫,亦有人翻譯為「軟體即服務」,意指雲端型軟體交付模型,其中雲端供應商可以開發並維護雲端應用程式軟體、提供自動軟體更新,並透過網際網路以隨用隨付的方式提供軟體給客戶。

 

主辦單位:經濟部中小企業處標誌經濟部中小及新創企業署

承辦單位:中國文化大學標誌

如對本站有任何問題或意見,歡迎聯絡客服中心。

  • 10042 臺北市中正區延平南路127號B1、4樓 
    中小企業創新育成協調中心(中國文化大學創新育成部)
  • 電話:02-7756-6176 傳真:02-2331-7556
  • 服務信箱:pccuincubator01@gmail.com (我們將儘速依序處理您的來信,回信時間約7個工作天)

本網站最佳瀏覽解析度為1360x768以上。