如何快速了解Sora文生視頻這一強大模型,制作AI短視頻,搶占市場先機,賺取第一桶金? 本書包括8章專題內容布局+73個官方視頻示例分析+490多張圖片全程圖解,隨書還贈送了8大資源:106分鐘同步教學視頻+111頁PPT教學課件+112組AI視頻生成提示詞+119個效果文件+57集AI繪畫教學視頻+56集AI文案寫作教學視頻+15000多組AI繪畫關鍵詞等。具體內容從下面兩條線展開...
如何快速了解Sora文生視頻這一強大模型,制作AI短視頻,搶占市場先機,賺取第一桶金? 本書包括8章專題內容布局+73個官方視頻示例分析+490多張圖片全程圖解,隨書還贈送了8大資源:106分鐘同步教學視頻+111頁PPT教學課件+112組AI視頻生成提示詞+119個效果文件+57集AI繪畫教學視頻+56集AI文案寫作教學視頻+15000多組AI繪畫關鍵詞等。具體內容從下面兩條線展開。 一條是技能線:從AI短視頻的相關技術入手,介紹Sora的概念特點、基本能力、技術原理、模型架構、生成式AI功能、指令編寫、提示詞庫、商業變現等內容,通過學習和實踐,讀者將能夠充分發揮Sora的強大功能,創作出令人驚嘆的短視頻作品,實現自己的創作和商業目標。 一條是案例線:本書非常注重Sora的實際應用,并通過大量的視頻案例分析,包括人像、風光、動物、植物、幻想、旅行等多種題材,同時涉及動畫短片、電影預告片、無人機航拍視頻、歷史鏡頭視頻、電商廣告視頻、游戲視頻等多個領域,全方位展示了Sora在不同場景下的應用效果。 本書是一本不可多得的AI短視頻生成技術指南,適合短視頻創作者、影視制作人員、攝影師、市場營銷人員、AI技術愛好者與開發者、教育工作者及研究人員等廣大群體閱讀。此外,本書還可以作為相關培訓機構和職業院校的參考教材。
明機 ·AI訓練師:對人工智能三要素算法、算力、算據(數據)擁有深厚的研究,熟悉AI算法和模型特性,擅長使用TensorFlow、PyTorch等框架技術進行模型訓練與產品開發; ·AI工程師:對Sora生成連貫視頻序列的循環神經網絡,Sora處理復雜視覺內容的空間時間補丁,Sora加快視頻生成速度的自回歸變壓器等技術,Sora成為世界模擬器等技術掌握頗深; ·AI先行者:AI提示詞庫創作者,首批應用ChatGPT、gemini、Stable Diffusion 、Midjourney、DALLoE、Firefly、Sora、Pika、Runway等AI工具的從業人員,擅長AI文案編寫、AI繪畫與AI視頻生成訓練。
◎ 市場優勢 隨著科技的飛速發展,人工智能已逐漸滲透到人們生活的方方面面,而AI短視頻生成技術作為其中的一顆“新星”,更是受到了廣泛關注。根據Mob研究院發布的報告顯示,2023年中國短視頻市場規模近3000億,用戶規模占整體網民的94.8%。這些數據表明,短視頻市場正在迅速增長,用戶規模龐大,且持續增長。 據市場研究公司Statista的報告,到2025年,全球AI視頻技術的市場規模預計將達到120億美元。根據艾媒咨詢公司的報告顯示,2023年中國AIGC產業規模約為143億元,預計到2030年,產業規模有望達到11441億元,這顯示出AIGC產業在未來幾年內具有巨大的增長潛力。 在這樣的大背景下,我們策劃編寫了本書,為廣大短視頻創作者、影視制作人員、市場營銷人員、AI技術愛好者與開發者、教育工作者,以及研究人員提供了一本關于Sora AI短視頻生成技術的全面指南。 ◎ 工具介紹 Sora作為一款引領短視頻創作新時代的人工智能工具,它集成了先進的算法和模型架構,為創作者提供了前所未有的創作自由度和便捷性。Sora的獨特之處在于其強大的生成式AI功能,使得創作者只需通過簡單的指令和提示詞庫,就能讓Sora為他們創作出獨具匠心的短視頻內容。 本書通過深入解讀Sora的技術原理、功能特點、提示詞優化及商業應用,幫助讀者更好地掌握和利用AI技術生成高質量的短視頻。通過學習本書內容,讀者將能夠全面掌握Sora AI短視頻生成技術的核心原理、功能特點及實戰應用,為自身在短視頻創作、影視制作、市場營銷等領域的發展提供有力支持。 ◎ 本書特色 本書是一本全面、深入、實用的技術指南,從Sora的基本概念、技術原理到實際應用案例,進行了系統而全面的介紹,無論是初學者還是專業人士,都能從中找到所需的知識和信息。本書特色如下。 (1)73個官方示例,實戰應用導向:為了讓讀者更好地將理論知識轉化為實際操作,本書精選了73個官方展示的AI視頻示例。這些示例涵蓋了不同的題材和用途,旨在幫助讀者快速掌握高效、高質量的短視頻制作技巧。通過學習和模仿這些示例,讀者將能夠輕松提升自己的AI短視頻制作水平,實現創意與技術的完美結合! (2)80多個小節講解,解析前沿技術:本書精心策劃了8大章共80多個小節,全方位、多角度地深入解析了Sora這一前沿的AI短視頻生成模型。通過對本書的專業解讀,讀者將能夠掌握其核心技術原理與優勢,不僅站在技術的前沿,更能輕松應對各種挑戰,成為AI短視頻領域的佼佼者。 (3)7大超值資源贈送,全面且豐富:為了給讀者帶來前所未有的學習體驗,精心準備了7大超值資源贈送給讀者,這些資源包括:教學視頻+PPT教學課件+AI視頻生成提示詞+效果文件+AI繪畫教學視頻+AI文案寫作教學視頻+AI繪畫關鍵詞等,讓您全方位了解AI短視頻的魅力。 ◎ 溫馨提示 (1)版本更新:在編寫本書時,是基于當前各種AI工具和網頁平臺的界面截取的實際操作圖片,但本書從編輯到出版需要一段時間,這些工具的功能和界面可能會有變動,請在閱讀時,根據書中的思路,舉一反三,進行學習。 (2)提示詞:也稱為提示、文本描述(或描述)、文本指令(或指令)、關鍵詞等。需要注意的是,即使是相同的提示詞,Sora等AI模型每次生成的視頻、圖像效果也會有差別,這是模型基于算法與算力得出的新結果,是正常的,所以大家會看到書里的截圖與視頻有所區別。用同樣的提示詞,自己再制作時,出來的效果也會有差異。 (3)效果問題:本書所展示的示例效果,均來源于Sora官方發布的演示視頻。鑒于Sora模型目前尚處于初期研發階段,它不可避免地存在一些問題。例如,生成的人物面部表情可能顯得不夠自然,肢體動作也可能略顯僵硬。此外,還可能出現多手多腳,以及其他不符合現實世界物理規律的現象。然而,我們深信這些問題都將在后續的版本中逐步得到改進和優化,為我們帶來更加出色的短視頻創作體驗。 (4)使用問題:本書內容寫于2024年2月底,此時Sora正處于內測階段,因此,本書關于Sora具體生成視頻的實戰教程部分內容較少,建議大家關注書封底的QQ群,等Sora正式開源后,作者會贈送具體的制作教程,到時請讀者朋友留意查收。 ◎ 資源獲取 如果讀者需要獲取書中案例的素材、視頻和課件,請使用微信“掃一掃”功能按需掃描下列對應的二維碼。 ◎ 作者售后 本書由明機編著,參與編寫的人員還有蘇高等人,在此表示感謝。由于編者知識水平有限,書中難免有疏漏之處,懇請廣大讀者批評、指正,溝通和交流請聯系微信:2633228153,添加時請輸入關鍵詞:明機。
第1章 認識Sora:強大的人工智能視頻生成模型 1 1.1 Sora是什么 2 1.1.1 Sora的基本介紹 2 【示例1】:走在東京街頭的時尚女性 3 1.1.2 Sora的功能特點 4 【示例2】:穿過東京郊區的火車窗外的倒影 4 1.1.3 Sora的競品對比 6 【示例3】:坐在天空中的一片云上看書的年輕人 7 1.1.4 Sora的核心優勢 9 1.1.5 Sora的創意用途 10 【示例4】:培養皿里的竹林和奔跑的熊貓 11 1.2 面對Sora,我們該思考的5個問題 12 1.2.1 文生視頻模型為什么會火 12 【示例5】:在日落時分愜意地漫步 16 1.2.2 Sora的發布意味著什么 17 【示例6】:手機鏡頭下的未來城市風貌 18 1.2.3 我們與Sora有何關系 19 【示例7】:“云人閃電”的科幻電影片段 20 1.2.4 我們該如何應對Sora 21 1.2.5 普通人該怎么入局 23 【示例8】:冬日長毛猛犸象的壯麗景色 24 第2章 能力解析:Sora如何高效地生成視頻 26 2.1 Sora的技術創新點 27 2.1.1 支持多樣化視頻格式 27 【示例9】:在大海中游動的海龜 27 2.1.2 改進的畫面構圖和框架 29 【示例10】:兔子和松鼠的奇妙混合物 30 2.1.3 語言理解與視頻生成 31 【示例11】:不同的人物在不同的城市散步 33 2.1.4 多模態輸入處理 34 【示例12】:無人機環繞拍攝的海邊建筑 35 2.1.5 可變的持續時間、分辨率、寬高比 36 【示例13】:白發男人的特寫鏡頭 37 2.2 Sora強大的視頻生成能力 37 2.2.1 3D一致性:以3D的視角呈現物體和人物的運動 37 【示例14】:推鏡頭展示熙熙攘攘的東京城市街道 38 【示例15】:搖鏡頭展示令人驚嘆的山水風光 39 2.2.2 長期一致性:保持視頻中的人物和場景的不變 40 【示例16】:一只達爾馬提亞狗從窗戶向外看 41 2.2.3 世界交互模擬:模擬人物與環境之間簡單的互動 42 【示例17】:模擬畫家的創作過程 42 【示例18】:模擬人物吃漢堡的場景 42 2.2.4 模擬數字世界:探索與創造的無界數字世界 43 【示例19】:模擬《我的世界》游戲場景 43 2.2.5 復雜元素生成能力:打造出逼真的虛擬場景 44 【示例20】:一大堆老式電視播放著不同的節目 44 【示例21】:逼真的動畫特寫場景 46 2.2.6 多鏡頭生成能力:呈現出豐富的視覺盛宴 46 【示例22】:用不同的鏡頭展示的機器人 47 2.3 Sora面臨的一些局限性和挑戰 48 2.3.1 模擬物理世界的局限性 48 【示例23】:破碎的玻璃杯 49 2.3.2 生成長視頻的難度 50 【示例24】:在沙漠中發現的塑料椅子 50 【示例25】:籃球通過籃筐后爆炸 51 2.3.3 理解復雜提示詞的準確性 52 【示例26】:慶祝生日的溫馨家庭場景 53 2.3.4 訓練模型的復雜性 54 【示例27】:35毫米電影風格的跑步動作場景 55 2.3.5 提升視頻生成的時效性 56 【示例28】:偏僻路上小狼嬉戲的場景 57 第3章 技術原理:解析Sora的技術特性與優勢 59 3.1 解析Sora的技術原理 60 3.1.1 Sora如何根據文本生成內容——Diffusion模型 60 3.1.2 Sora如何處理復雜視覺內容——時間空間補丁 62 3.1.3 Sora如何生成連貫的視頻序列——循環神經網絡 63 【示例29】:中國農歷新年慶祝視頻 64 3.1.4 Sora如何生成不同風格的視頻——生成對抗網絡 65 3.1.5 Sora如何加快視頻的生成速度——自回歸變換器 67 3.2 Sora在視頻生成過程中的3個關鍵步驟 68 3.2.1 步驟1:視頻壓縮網絡 68 【示例30】:一窩金毛尋回犬在雪地里玩耍 68 3.2.2 步驟2:時間空間潛在補丁提取 69 3.2.3 步驟3:視頻生成的Transformer模型 70 【示例31】:淘金熱期間加利福尼亞州的歷史錄像 70 3.3 Sora技術的未來展望 71 3.3.1 技術革新與性能升級:速度更快、穩定性更強、體驗更流暢 71 3.3.2 跨領域融合與拓展應用:讓生活更加多姿多彩、充滿無限可能 72 第4章 模型架構:Sora的基礎是世界通用模型 73 4.1 認識世界通用模型 74 4.1.1 什么是世界通用模型 74 4.1.2 世界通用模型的作用是什么 75 【示例32】:Santorini的航拍建筑美景 76 4.1.3 多模態模型促進AI更好地理解真實世界 77 【示例33】:一列蒸汽火車行駛在高架橋上 78 4.1.4 世界通用模型打破了虛擬與現實的邊界 79 【示例34】:愜意漫步的南非婦女 79 4.1.5 世界通用模型的代表——Runway 80 4.2 Sora將視頻生成模型作為世界模擬器 81 4.2.1 用大語言模型的方法理解視頻 81 【示例35】:一群紙飛機在茂密的叢林中飛舞 82 【示例36】:愉快漫步的老人 83 【示例37】:白雪皚皚的東京城 84 4.2.2 實現對物理世界的“涌現” 85 【示例38】:可愛的達爾馬提亞狗 85 4.2.3 模擬真實物理世界的運動 87 【示例39】:壯觀的海岸風光 88 4.3 Sora模型訓練的核心技術 90 4.3.1 自然語言理解 90 4.3.2 生成式人工智能模型 92 【示例40】:老年人的悠閑生活與美麗的自然風光 93 4.3.3 場景構建與精細化渲染 96 4.3.4 AI驅動的動畫技術 98 【示例41】:眨眼的特寫鏡頭 99 4.3.5 個性化定制與持續優化 100 【示例42】:不同風格的袋鼠漫步場景 101 第5章 功能詳解:使用Sora快速生成視頻 105 5.1 Sora的文生視頻功能 106 5.1.1 Sora的注冊方法 106 5.1.2 申請Sora的內測資格 110 5.1.3 使用文生視頻功能 113 5.2 Sora的其他AI生成功能 114 5.2.1 圖生視頻:為DALL·E圖像制作動畫 114 【示例43】:活潑可愛的柴犬 115 【示例44】:一個多樣化的怪物家族 116 【示例45】:由字母組成的云朵圖片 117 【示例46】:沖浪者在歷史大廳中駕馭巨浪 118 5.2.2 視頻生視頻:向前或向后擴展視頻的時長 119 【示例47】:舊金山的高空城市纜車 119 【示例48】:永無止境的騎行場景 122 5.2.3 視頻到視頻編輯:轉換視頻的風格和環境 123 【示例49】:飛馳在叢林中的跑車 123 5.2.4 連接視頻功能:創建神奇的無縫過渡效果 125 【示例50】:無人機視頻與蝴蝶視頻的連接 126 【示例51】:越野車視頻與豹子視頻的連接 128 5.2.5 圖像生成功能:為用戶帶來卓越的體驗 130 第6章 指令編寫:優化提示詞提升Sora的生成效果 133 6.1 編寫Sora提示詞的基礎思路 134 6.1.1 明確具體的視頻元素 134 【示例52】:一只在拍攝視頻的柯基犬 134 6.1.2 詳細描述場景細節 135 【示例53】:一朵花生長的定格動畫 135 6.1.3 創造性地使用提示詞 136 【示例54】:一群魚在紐約的街道上游動 136 6.1.4 構思引人入勝的角色和情節 137 【示例55】:一只貓叫醒正在睡覺的主人 137 6.1.5 用逐步引導的方式構建提示詞 139 【示例56】:擠滿了工人的建筑工地 139 6.2 Sora提示詞的編寫技巧 140 6.2.1 如何選擇Sora的提示詞 140 【示例57】:基納巴丹干河上的野生動物 141 6.2.2 Sora提示詞的編寫順序 142 【示例58】:美術館內的藝術盛宴 143 6.2.3 編寫Sora提示詞的注意事項 143 【示例59】:跳迪斯科舞的卡通袋鼠 144 第7章 提示詞庫:打造專業級視頻效果必備的要素 145 7.1 Sora內容型提示詞 146 7.1.1 主體特征 146 【示例60】:在南極洲愉快漫步的女人 147 【示例61】:不同主體特征的視頻效果 148 7.1.2 場景特征 150 【示例62】:色彩斑斕的魚類和海洋生物 151 7.1.3 藝術風格 152 【示例63】:太空冒險故事的電影預告片 153 7.2 Sora標準化提示詞 155 7.2.1 畫面構圖 155 【示例64】:變色龍的特寫鏡頭 156 7.2.2 視線角度 157 【示例65】:維多利亞冠鴿的側面視角 158 7.2.3 畫面景別 159 【示例66】:玻璃球體里的小矮人 160 7.2.4 色彩色調 161 【示例67】:在茂密的花園里奔跑的虎斑貓 162 7.2.5 環境光線 163 【示例68】:月光下的狼嚎剪影動畫 164 【示例69】:在霓虹燈城市中嬉戲的小狗 165 7.2.6 鏡頭參數 165 【示例70】:深海中的大章魚和帝王蟹之戰 166 第8章 商業變現:從文本到視頻的創收之路 168 8.1 Sora未來可能的商業場景應用 169 8.1.1 電商產品展示 169 8.1.2 視頻廣告制作 170 8.1.3 游戲開發和動畫片制作 170 【示例71】:展示游戲《我的世界》 171 【示例72】:水獺的熱帶沖浪冒險 172 8.1.4 電影電視節目制作 173 【示例73】:海盜船激戰瞬間 173 8.1.5 教育內容制作 174 8.2 如何利用Sora實現多渠道變現 174 8.2.1 廣告收入與贊助變現 175 8.2.2 知識付費變現 175 8.2.3 提示詞交易變現 176 8.2.4 內容創作變現 177 8.2.5 Sora的其他變現方式 178
ISBN:978-7-122-45340-2
語種:漢文
開本:16
出版時間:2024-06-01
裝幀:平
頁數:180