古 · 典 · 园 · 林 · 转 · 译 园冶 × 海岛

海岛上的园林

Seedance 1.0 Fast首尾帧 · 无提示词
Seedance 1.0 Fast智能多帧 · 无提示词
Seedance 2.0 Fast全能参考 · 简单提示词
Seedance 2.0全能参考 · 有提示词

设计说明 点击播放语音

这座设计的核心想法,是把江南古典园林的意境“搬”到一座海岛上。

选一处有坡有谷的海岛角落,不大动土,顺着山势盖房子——原木做梁,海藻铺顶,贝壳贴墙,礁石垒脚,小小的屋子高低散落在山坡上,像是从岛上自己长出来的。

空间的玩法借了古人的智慧:把大海当园林里的水池,碎石小路当回廊,观海的好位置搁一座木亭,靠水的地方搭一方草台。山泉引下来绕着石头和房子走,就有了“曲水流觞”的味道;岛上天生的怪石,有的独立成景像微缩的山峰,有的堆在一起像悬崖峡谷,树影投过来,天然就是一幅画框。走到近岸,浅滩里透过清水能看见珊瑚和游鱼;抬头远望,海天连成一线,四季各有各的风景。

造园的手法也讲究:地势低的挖深,高的垫起,让大树长在山腰礁石间;碍眼的杂枝修掉,让每栋房子都能望见海,海也能映进每扇窗。

一句话概括:以海为池、以岛为山,四百步走完山与海,一座园子装下整个江南。

Scroll

古典园林转译 × AI 短片

我去年来做这场讲座时,几乎没做什么准备,当时也非常仓促,所以当时应该只讲了怎么做图、怎么用这些 AI 工具。

今年接到古典园林转译这个题目后,我的第一反应是:要把古典园林放到一座海岛上——我想做一个在我看来不存在的组合。后来了解到,大家更多是在做现代空间的转译,所以我觉得这个方向可以形成互补。

至于为什么选《园冶》:它是最经典的一部造园理论古籍,网上有全文,也有可以获取原文的古籍数据库。我也想借它来教大家,怎样比较快速地通过 AI 工具获取这类公开文本。

另外要说明一点:你现在在这个网页里看到的海岛设计,有些地方其实考虑得还不够周全,画面里也可能有不少不太合理的地方——这些往往需要在生成时多抽几轮、多试几个方向。不过今天更主要的是把整个做事思路,以及工具怎么用、流程怎么串起来,跟大家走一遍;也希望能提供一些你们回去可以尝试的做法。

使用了哪些工具?

Cursor

AI 代码编辑器:用自然语言对话写代码、改网页;Agent 模式可自动执行任务、读写文件。本讲座里用来采集《园冶》篇目,以及搭建这个落地页。

飞书多维表格

在线表格 + AI 字段捷径:在某一列写指令、引用其他列内容,即可批量翻译、总结、生成提示词,类似 Excel 但不用写代码,可接入 DeepSeek、豆包等国内模型。

Nano Banana

Google 的 AI 出图与图像编辑模型(Gemini 2.5 Flash Image,圈内常称 Nano Banana):支持文生图、图生图与多轮改图。本讲座用它生成基准图,再扩展成 2×2 竖屏四宫格分镜。

即梦

字节跳动的 AI 创作平台,内置 Seedance 视频模型。支持文生视频、图生视频,以及首尾帧、智能多帧、全能参考等多种参考方式,把分镜图转成竖屏短片。

MiniMax

语音合成(TTS)平台「海螺语音」:输入文字生成自然旁白,可调语速、情绪与音色。本讲座用来生成封面右侧设计说明的讲解音频。

工作流程又是什么样的?

Cursor 对话截图:向 AI 提供古文网《园冶》书目链接并说明爬取为表格的需求,以及生成 TSV、CSV 与 Python 脚本的回复摘要
Screenshot · Cursor 中给出链接与采集说明
Step 01

文章采集

Cursor

演示:公开古籍站点 · 不必手抄一条条摘录

做之前我没想好是「做一个小的聚焦点」还是「梳理整套造园思路」。所以第一步先把全文爬下来。网上其实有电子书或 txt,但我想演示:对没有反爬、可公开访问的古籍或数据库,如何用工具减少手工摘录。不过大家用这个工具,一定要注意别太过分……

我直接从公开站点入手,给 Cursor 一个页面链接 + 采集要求,快速拿到可结构化的篇目数据。

打开古文岛《园冶》原页面

Tips · 语音输入

平时为省时间我会直接用语音输入,语气词多也没关系。先把需求完整说出来,让思路不要被打字速度打断,再让 AI 帮我整理出来,效率提升超级多。

Step 02

飞书多维表格 · 白话翻译与场景提示词

飞书

上一步得到表格后,我把表格内容复制进飞书多维表格。这个工具对不太接触代码、不想折腾国外软件的同学比较友好。它可以等同于 Excel + DeepSeek、豆包等大模型。

打开飞书多维表格 · 《园冶》白话翻译与场景提示词

在飞书多维表格里,简单讲,后面一列的内容可以由前一列内容生成。表格字段的设置,就相当于智能体指令的设置。有自己设置过智能体的同学应该知道智能体的本质就是让它模拟一个角色,或者让它重复某一个标准化的工作流程。

设置好之后,测试时我一般先自定义 2 行跑小样本,满意再「整列」批量。

一开始,我不太确定 AI 能否直接从文言里抽「设计手法」,所以先白话翻译一道;翻译成白话也有考虑到后面要生成图片,文言也容易让画面偏掉。

我试过按行提取古典园林手法,但《园冶》很多是随笔、意境,不全是方法论——读完后我决定中间「手法→设计」整段省掉,把想象交给 AI。

新增一列「场景提示词」,用于出图。提示词写得比较长,核心是:电影感写实、海上孤岛、人视角、9:16、材料皆取自岛上可得的自然材料(原木、海藻、贝壳、礁石等),并引用【白话翻译】。

整个设计的设计说明,是从【场景提示词】和【白话翻译】综合推导出来的。

飞书多维表格截图:篇目、分节与文言文正文字段
图 1 飞书多维表格 · 篇目与正文 把 Cursor 采集的篇目与分节导入飞书,作为后续 AI 字段的输入基础。
图 2 - 图 4 AI 字段配置 · 白话翻译 / 场景提示词 / 设计说明 三列字段的指令设置:后一列引用前一列内容,依次生成白话翻译、出图提示词与设计说明。
图 2 飞书字段配置截图:白话翻译字段使用自定义 AI 自动填充指令
图 3 飞书字段配置截图:场景提示词字段的 AI 指令内容
图 4 飞书字段配置截图:海岛设计说明字段引用场景提示词与白话翻译生成说明文
飞书多维表格 DeepSeek 豆包
Step 03

图片生成 · 2×2 竖屏四宫格

Nano Banana

我们先用前面生成的场景提示词,生成了以下第一张图片,而后用这一张图片,生成了不同高度、不同角度的 4 张分镜。

近一年我们在短片里反复测试从图片到视频的最高效的方式:从「一张图固定角色」到 Sora2 时代前后用九宫格 / 二十五宫格做连续分镜,再到现在用更复杂的故事版交给视频模型直接成片。我没发现四宫格的性价比是最高的。这个我之前在我的视频号里发了一期视频,如果大家有兴趣可以去看看。

出图使用 Nano Banana Pro。下面链接是我们把 Nano Banana Pro 集成到我们自己的项目工作平台里面的做法,从素材、到提示词、到最终生成的图片,可以都储存在一个平台上,可以分项目(如果大家在做实验测试的过程中,想批量出场景样本图片的话,有需要可以找我们讨论,我们很欢迎)。

打开项目平台 · 2×2 竖屏四宫格出图

第一张原始分镜图:海岛园林主视角
图 1 第一张原始分镜图 先用场景提示词生成第一张基准图,确定空间关系与整体气质。
点击展开提示词
2×2 的竖屏四宫格,根据参考图,生成 4 个不同角度、不同高度的分镜图。
由原始分镜图得到的四宫格图
图 2 由原始分镜扩展出的四宫格 以图 1 为输入,扩展成 2×2 的多机位分镜集合。
图 3 - 图 7 用于后续视频步骤的 5 张基础单图 四宫格 + 原始分镜图共同沉淀为后续做视频的基础素材。
图 3 视频基础图 1:海岛鸟瞰视角
图 4 视频基础图 2:建筑近景视角
图 5 视频基础图 3:亭子俯视视角
图 6 视频基础图 4:临海平台视角
图 7 视频基础图 5:原始主视角复用图
Nano Banana 项目平台 2×2 分镜
Step 04

视频 · 即梦 Seedance 多种跑法

即梦
即梦工作台截图:Seedance 1.0 Fast 模式,仅上传首尾两帧参考图,未填写提示词,生成 5 秒竖屏视频
方式 01 · 封面第 1 支 Seedance 1.0 Fast · 首尾帧 · 无提示词 只给首帧与尾帧,不写提示词,让模型自行补全 5 秒过渡。
即梦工作台截图:Seedance 1.0 Fast 智能多帧模式,上传四张关键帧参考图,未填写提示词,生成 15 秒竖屏视频
方式 02 · 封面第 2 支 Seedance 1.0 Fast · 智能多帧 · 无提示词 四宫格四张图依次作为关键帧,开「智能多帧」,不写提示词,成片约 15 秒。
即梦工作台截图:Seedance 2.0 Fast 全能参考模式,上传四张参考图,提示词为海岛旅游宣传片只要音乐不要旁白和文案,生成 15 秒竖屏视频
方式 03 · 封面第 3 支 Seedance 2.0 Fast · 全能参考 · 简单提示词 四宫格四张图全部丢进即梦,开「全能参考」,简单写:海岛旅游宣传片,只要音乐、不要旁白和文案。
① 参考图 · 红线标穿越机路径 海岛鸟瞰参考图,上用红色线条与数字标注穿越机飞行路线
② 即梦 · 只上传这一张参考图 即梦工作台截图:Seedance 2.0 全能参考模式,仅上传一张带红线飞行路径的参考图,并填写让相机沿路径飞行的提示词
方式 04 · 封面第 4 支 Seedance 2.0 · 全能参考 · 有提示词 只给 1 张参考图:在图上用红线标出穿越机飞行路径,再进即梦开「全能参考」,写提示词让模型沿路径飞行并去掉画面中的红线与箭头。
即梦 Seedance 1.0 Fast Seedance 2.0 Fast Seedance 2 首尾帧 智能多帧 全能参考 穿越机路径
Step 05

网页制作 · 讲座内容上线

Cursor MiniMax

做视频的过程其实比较简单,我也比较早就把成片发给了邵老师。一开始想的是现场演示——但这样时间很难控,讲得也不够系统,所以昨天花了一天,把想讲的整个流程从头到尾先整理成 PPT:没有去排版,就是每一页拉一个框,对着讲,把要说的全部输进去,大概七八页。

然后我把这七八页的文字稿发给 Cursor,让它按这个结构搭网页。架构生成之后,我再一点一点把过程截图、视频、各软件的 logo 发给它,让它加进去——网页里的跳转链接也是架构搭好之后,我发链接、它帮我嵌进去的。最后 Cursor 帮我把网站部署到自己的后台,现在可以用自己的笔记本登录去看这套内容。

这个网页现在还不太能直接给到大家:里面有些内容还没上线,有些工具也是我们内部在用的。如果大家对细节有兴趣,欢迎之后再找我们聊。

语音是后面才加的——想到尽可能全面地展示工具怎么用、尽可能覆盖不同类型的 AI 工具。旁白由 MiniMax 生成,接到封面右侧设计说明,实现「点击文字从头播放」的讲解体验。

打开 MiniMax · 文字转语音

MiniMax 文字转语音工作台截图:输入设计说明全文,选择音色并生成旁白音频
Cursor MiniMax 网页制作

延伸案例:Beaststown世界杯限量版毛绒 IP

Claude
Gemini
Nano Banana
ElevenLabs
Suno
即梦
提示词拆解 角色设定优先 九宫格分镜 11labs 旁白 Suno 配乐 40 秒内成片

Beaststown 是德国百年玩具品牌 SIGIKID 旗下的一系列偏个性、略丑萌的「野兽」IP,要为世界杯做宣传视频。他们有一百多个野兽角色,每只玩偶设计师都会写一段故事,但是这个故事的语境很德国,很多时候我们要反复沟通、查很多社会方面的资料,才能抓到他们的点。这只鹰的人设是一个超级足球迷。

初稿:把设计师文案逐段进提示词 → 动画风分镜 → 11labs 德式激动旁白 → 音频进 AI 音乐软件做配乐 → 成片约 1 分半。客户反馈:不要漫画感,要完整呈现毛绒质感;且未上线视频要考虑完播,必须压到 40 秒内,无法讲完原故事。

第二稿:我们改为「疯狂球迷看完一整场球」的全过程;并调整策略:先做音乐。他们要加德国国歌,但出于商用版权限制,我们只能自己哼一小段,做成和声。国歌和后面的音乐要融合,那我们就要通过延长音乐的方式完成整首歌。歌词量控制在 40 秒内能唱完,要洗脑。再按歌词配图。昨天这个视频刚刚定稿,他们非常喜欢。

第 1 稿 · 约 1 分半
第 2 稿 · 40 秒内

萧条的专业 vs 有很多可能性的市场

邵老师提到大家可能对专业不太乐观;我的感受是:上学加工作两年里学的设计、审美、阅读、研究方法与思路,后来都用得上。以前容易钻在很学术、很细的议题里,自娱自乐、缺少产出与市场检验。

张总把我从那种思维惯性里拉出来:这些想法在学术圈外的人很难想到,但若一直泡在小众课题里,就只剩自我满足。后来在很多小项目里拆解、实践、发出来拿反馈——例如为世界杯焦头烂额时,用「爬数据」方式下载戛纳创意节亚洲区获奖作品 → 表格 → Claude 读表提观点 → 发了一篇内容,意外很多人加好友(果汁、地产、喜羊羊团队、内衣品牌等),让我们知道市场在要什么。

AI 绕不过去,但不必悲观:在学校就可以开始试。张总、范旭若你们有「市场 / 落地 / 职业路径」类问题,也欢迎向他们请教——我很难把吸收到的社会认知一次讲清楚,所以请他们一起来。