Cursor
AI 代码编辑器:用自然语言对话写代码、改网页;Agent 模式可自动执行任务、读写文件。本讲座里用来采集《园冶》篇目,以及搭建这个落地页。
这座设计的核心想法,是把江南古典园林的意境“搬”到一座海岛上。
选一处有坡有谷的海岛角落,不大动土,顺着山势盖房子——原木做梁,海藻铺顶,贝壳贴墙,礁石垒脚,小小的屋子高低散落在山坡上,像是从岛上自己长出来的。
空间的玩法借了古人的智慧:把大海当园林里的水池,碎石小路当回廊,观海的好位置搁一座木亭,靠水的地方搭一方草台。山泉引下来绕着石头和房子走,就有了“曲水流觞”的味道;岛上天生的怪石,有的独立成景像微缩的山峰,有的堆在一起像悬崖峡谷,树影投过来,天然就是一幅画框。走到近岸,浅滩里透过清水能看见珊瑚和游鱼;抬头远望,海天连成一线,四季各有各的风景。
造园的手法也讲究:地势低的挖深,高的垫起,让大树长在山腰礁石间;碍眼的杂枝修掉,让每栋房子都能望见海,海也能映进每扇窗。
一句话概括:以海为池、以岛为山,四百步走完山与海,一座园子装下整个江南。
Lecture · 讲座开场
我去年来做这场讲座时,几乎没做什么准备,当时也非常仓促,所以当时应该只讲了怎么做图、怎么用这些 AI 工具。
今年接到古典园林转译这个题目后,我的第一反应是:要把古典园林放到一座海岛上——我想做一个在我看来不存在的组合。后来了解到,大家更多是在做现代空间的转译,所以我觉得这个方向可以形成互补。
至于为什么选《园冶》:它是最经典的一部造园理论古籍,网上有全文,也有可以获取原文的古籍数据库。我也想借它来教大家,怎样比较快速地通过 AI 工具获取这类公开文本。
另外要说明一点:你现在在这个网页里看到的海岛设计,有些地方其实考虑得还不够周全,画面里也可能有不少不太合理的地方——这些往往需要在生成时多抽几轮、多试几个方向。不过今天更主要的是把整个做事思路,以及工具怎么用、流程怎么串起来,跟大家走一遍;也希望能提供一些你们回去可以尝试的做法。
Workflow
AI 代码编辑器:用自然语言对话写代码、改网页;Agent 模式可自动执行任务、读写文件。本讲座里用来采集《园冶》篇目,以及搭建这个落地页。
在线表格 + AI 字段捷径:在某一列写指令、引用其他列内容,即可批量翻译、总结、生成提示词,类似 Excel 但不用写代码,可接入 DeepSeek、豆包等国内模型。
Google 的 AI 出图与图像编辑模型(Gemini 2.5 Flash Image,圈内常称 Nano Banana):支持文生图、图生图与多轮改图。本讲座用它生成基准图,再扩展成 2×2 竖屏四宫格分镜。
字节跳动的 AI 创作平台,内置 Seedance 视频模型。支持文生视频、图生视频,以及首尾帧、智能多帧、全能参考等多种参考方式,把分镜图转成竖屏短片。
语音合成(TTS)平台「海螺语音」:输入文字生成自然旁白,可调语速、情绪与音色。本讲座用来生成封面右侧设计说明的讲解音频。
演示:公开古籍站点 · 不必手抄一条条摘录
做之前我没想好是「做一个小的聚焦点」还是「梳理整套造园思路」。所以第一步先把全文爬下来。网上其实有电子书或 txt,但我想演示:对没有反爬、可公开访问的古籍或数据库,如何用工具减少手工摘录。不过大家用这个工具,一定要注意别太过分……
我直接从公开站点入手,给 Cursor 一个页面链接 + 采集要求,快速拿到可结构化的篇目数据。
Tips · 语音输入
平时为省时间我会直接用语音输入,语气词多也没关系。先把需求完整说出来,让思路不要被打字速度打断,再让 AI 帮我整理出来,效率提升超级多。
上一步得到表格后,我把表格内容复制进飞书多维表格。这个工具对不太接触代码、不想折腾国外软件的同学比较友好。它可以等同于 Excel + DeepSeek、豆包等大模型。
在飞书多维表格里,简单讲,后面一列的内容可以由前一列内容生成。表格字段的设置,就相当于智能体指令的设置。有自己设置过智能体的同学应该知道智能体的本质就是让它模拟一个角色,或者让它重复某一个标准化的工作流程。
设置好之后,测试时我一般先自定义 2 行跑小样本,满意再「整列」批量。
一开始,我不太确定 AI 能否直接从文言里抽「设计手法」,所以先白话翻译一道;翻译成白话也有考虑到后面要生成图片,文言也容易让画面偏掉。
我试过按行提取古典园林手法,但《园冶》很多是随笔、意境,不全是方法论——读完后我决定中间「手法→设计」整段省掉,把想象交给 AI。
新增一列「场景提示词」,用于出图。提示词写得比较长,核心是:电影感写实、海上孤岛、人视角、9:16、材料皆取自岛上可得的自然材料(原木、海藻、贝壳、礁石等),并引用【白话翻译】。
整个设计的设计说明,是从【场景提示词】和【白话翻译】综合推导出来的。
我们先用前面生成的场景提示词,生成了以下第一张图片,而后用这一张图片,生成了不同高度、不同角度的 4 张分镜。
近一年我们在短片里反复测试从图片到视频的最高效的方式:从「一张图固定角色」到 Sora2 时代前后用九宫格 / 二十五宫格做连续分镜,再到现在用更复杂的故事版交给视频模型直接成片。我没发现四宫格的性价比是最高的。这个我之前在我的视频号里发了一期视频,如果大家有兴趣可以去看看。
出图使用 Nano Banana Pro。下面链接是我们把 Nano Banana Pro 集成到我们自己的项目工作平台里面的做法,从素材、到提示词、到最终生成的图片,可以都储存在一个平台上,可以分项目(如果大家在做实验测试的过程中,想批量出场景样本图片的话,有需要可以找我们讨论,我们很欢迎)。
做视频的过程其实比较简单,我也比较早就把成片发给了邵老师。一开始想的是现场演示——但这样时间很难控,讲得也不够系统,所以昨天花了一天,把想讲的整个流程从头到尾先整理成 PPT:没有去排版,就是每一页拉一个框,对着讲,把要说的全部输进去,大概七八页。
然后我把这七八页的文字稿发给 Cursor,让它按这个结构搭网页。架构生成之后,我再一点一点把过程截图、视频、各软件的 logo 发给它,让它加进去——网页里的跳转链接也是架构搭好之后,我发链接、它帮我嵌进去的。最后 Cursor 帮我把网站部署到自己的后台,现在可以用自己的笔记本登录去看这套内容。
这个网页现在还不太能直接给到大家:里面有些内容还没上线,有些工具也是我们内部在用的。如果大家对细节有兴趣,欢迎之后再找我们聊。
语音是后面才加的——想到尽可能全面地展示工具怎么用、尽可能覆盖不同类型的 AI 工具。旁白由 MiniMax 生成,接到封面右侧设计说明,实现「点击文字从头播放」的讲解体验。
Case Study
Beaststown 是德国百年玩具品牌 SIGIKID 旗下的一系列偏个性、略丑萌的「野兽」IP,要为世界杯做宣传视频。他们有一百多个野兽角色,每只玩偶设计师都会写一段故事,但是这个故事的语境很德国,很多时候我们要反复沟通、查很多社会方面的资料,才能抓到他们的点。这只鹰的人设是一个超级足球迷。
初稿:把设计师文案逐段进提示词 → 动画风分镜 → 11labs 德式激动旁白 → 音频进 AI 音乐软件做配乐 → 成片约 1 分半。客户反馈:不要漫画感,要完整呈现毛绒质感;且未上线视频要考虑完播,必须压到 40 秒内,无法讲完原故事。
第二稿:我们改为「疯狂球迷看完一整场球」的全过程;并调整策略:先做音乐。他们要加德国国歌,但出于商用版权限制,我们只能自己哼一小段,做成和声。国歌和后面的音乐要融合,那我们就要通过延长音乐的方式完成整首歌。歌词量控制在 40 秒内能唱完,要洗脑。再按歌词配图。昨天这个视频刚刚定稿,他们非常喜欢。
Reflection
去年回来帮老师上课的时候,看到的和听到的学弟学妹们的状态让我感觉冲击很大……
我的感受是,本科期间的审美训练、设计训练,硕士期间跟着邵老师的数据分析、市场和社会调查、写论文的逻辑、实验设计的方法——这些过程中建立的思维方式,对我现在创业帮助非常大。说实话,具体的理论和结论可能没有那么重要,但训练本身是真的有用的。只要你还在做创作、还在产出创意性的内容,这些能力就一直在发挥作用。
今天跟我一起来的范旭,我之前在天华的同事,做了五六年规划,辞职之后跟我们一起做 AI 视频和内容策划。他之前完全没做过这个方向,但上手非常快——你会发现行业是互通的,底层能力是可以迁移的。
然后我觉得比较幸运的一件事,是在快要步入社会的时候认识了张总。他反复跟我说一句话:你学的东西、你产出的东西,都是有价值的——但你没有用一个有效的方式让大众接收到。说实话,我在创业之前一直没意识到这件事有多重要。我以前觉得东西做好就行了,但现在发现,你做得再好,如果没有人看到、没有人理解它的价值,你不仅活不下去,而且缺少反馈会反过来削弱你的创作积极性。