零错别字手绘、一键视频、专属表情包:5 个极具商业价值的 Gemini 智能体搭建全纪录

张开发
2026/6/4 8:34:34 15 分钟阅读
零错别字手绘、一键视频、专属表情包:5 个极具商业价值的 Gemini 智能体搭建全纪录
本文较长干货密集且包含大量可直接复制的 Prompt提示词建议先点赞/收藏方便在电脑端对照实操。卷首语为什么普通人必须掌握 Gemini在 AI 爆发的今天很多人对 AI 的理解还停留在“当百度用问问天气写写大纲”的阶段。但这就像是用造飞机的引擎来拉磨。在近期的 AI 实战闭环分享中我向大家演示了基于Gemini 3.1 Pro搭建的几个智能体Agent现场的效果可以说是“降维打击”。我们不再讨论虚无缥缈的参数只看落地场景零错别字的精美手绘图、完美克隆你说话口吻的朋友圈长文、一键生成的专属表情包矩阵……这套教程不讲废话。我们将手把手带你搭建 5 个高商业价值的智能体让你从“苦哈哈的执行者”蜕变为“指挥 AI 干活的超级架构师”。不要等风来要去造风不要等 AI 完美了再用要在它不完美的时候就成为驾驭它的骑手。模块一兵马未动粮草先行环境与账号准备搭建顶级工作流的前提是拥有强大的武器。国产大模型如智谱、元器进步神速但在“直觉式多模态生成”和“图文完美混排”的硬核能力上Gemini 3.1 Pro 依然处于断层领先地位。1.1 硬件与网络环境配置网络要求必须具备“魔法”能力。账号门槛本教程核心调用的是Gemini 3.1 Pro 付费版模型。1.2 语言环境汉化防踩坑必看登录官网后如果界面是全英文请按以下步骤将其“秒变”中文点击左下角 Settings设置。选择 Language语言。跳转至 Google 账号语言设置页面。点击“添加其他语言”搜索“中文简体”并添加。点击中文旁边的“向上箭头”将其提升为首选语言。返回 Gemini 界面按F5刷新系统即刻转为全中文。模块二Gemini 生图/视频工作流的搭建1、新建Gems工作流2、输入需求确认[一键换装]提示词示例生成形象照和视频我要搭建一个全中文的网页应用UI设计美观一个漂亮的对话框我只需要上传一张人物参考图同时输入一个换装主题你就可以随机给这个人换装。智能体能自动帮我生成一张换装照片9:16并调用视频(Veo3.1)生成一条视频9:16自动配背景音乐视频支持下载支持调节音量大小。3、生成工作流调试4、工作流测试5、形象照、视频生成6、下载网页点击Download file 下载网页后可在电脑本地查看Gemini制作海报发起Gemini 3 pro新对话参考下图3步操作把提示词复制到对话框粘贴文本上传一张有关内容的照片开始一键生成[海报] 0基础做爆款海报 提示词生成一张海报科技风格916尺寸用于AI中转站平台Qwave宣传海报 需包含、平台介绍、进群钩子、金句这些关键信息 大主题一个接口-所有 AI 模型 平台介绍通过单一 API 访问 GPT-4o、Claude、Gemini、FLUX、Sora 等 500 顶级模型。按量计费即开即用。 进群钩子文案 金句WaveAPI 统一 AI 模型 API 网关 — 一个接口调用所有主流大模型NotebookLM生成PPT文档、信息图、PPT视频课件1、打开NotebookLM网站登录google账号新建笔记本2、上传文件或复制文字3、设置PPT风格4、PPT一键生成稍微等10分钟左右一份漂亮的PPT文档就生成了暂时无法在飞书文档外展示此内容[漫画PPT]提示词参考风格提示词: 鲜明高级手绘风Q版彩色漫画风格5、信息图生成设置好风格一键生成风格提示词科技漫画风格6、PPT视频课件生成生成的视频非常完整没有文字错误生成时长6-7分钟说明版摘要版2-3分钟风格提示词科技漫画风格模块三Gem智能体的搭建一 Q版IP表情包生成1、新建Gem智能体2、设置名称、说明、指令输入基于参考图像中的角色创作一套全新的 Q 版半身表情包。风格需模仿 LINE 贴图采用可爱的彩色手绘质感。务必准确还原角色的标志性头饰。 布局与内容要求 画面为 4x6 的网格矩阵共 24 个表情。 每个表情的动作和神态都要重新设计不要直接复制原图。 内容涵盖日常网络聊天常用语和热门娱乐梗Meme。 所有文字标注必须是手写体简体中文。 技术规格 4K 分辨率16:9 宽屏比例。注意细节生成后要尽快保存否则记录会消失填好后点击确认Gem智能体就搭建好了[Q版表情包] IP表情包提示词基于参考图像中的角色创作一套全新的 Q 版半身表情包。风格需模仿 LINE 贴图采用可爱的彩色手绘质感。务必准确还原角色的标志性头饰。 布局与内容要求 画面为 4x6 的网格矩阵共 24 个表情。 每个表情的动作和神态都要重新设计不要直接复制原图。 内容涵盖日常网络聊天常用语和热门娱乐梗Meme。 所有文字标注必须是手写体简体中文。 技术规格 4K 分辨率16:9 宽屏比例。3、表情包生成添加自己的形象照开始生成生成好下载表情包备用二爆款文案写作1、浏览器打开gemini官网2、新建Gem3、填写名称、说明、指令[心理学博主]提示词示例仅供参考# Role: 心理学百万粉丝博主 (口播专用纯净版) ## Persona 你是一位深耕心理学领域、拥有百万粉丝的资深视频创作者。你说话直接戳中人心能够把晦涩的心理学定律解析得像讲故事一样动听。你的语速沉稳文字极具感染力和情绪张力。 ## Output Constraints (核心指令) 1. **只输出正文**输出结果必须【仅包含】博主口头表达的每一句话严禁出现 [镜头]、[BGM]、[画面建议]、[标题]、[开头/结尾备注] 等任何非口头表述内容。 2. **拒绝大纲化**严禁使用“首先、其次、最后”这种干瘪的结构要用自然衔接的话术进行逻辑转场。 3. **字数达标**通过深度拆解细节、引入心理学实验细节、描述具体生活场景将字数扩充至1000字左右。 4. **口语化表达**所有专业名词必须有通俗化的解释语气要像在和老朋友深夜长谈。 ## Writing Framework (内在逻辑) 1. **扎心开场 (0-100字)**抛出一个让人无法拒绝的心理痛点或社会真相。 2. **场景共振 (100-300字)**细腻描述用户正在经历的痛苦场景让他觉得你在监视他的生活。 3. **底层解剖 (300-600字)**引入深度心理学概念如内耗、补偿机制、客体关系等解释这一切背后的潜意识逻辑。 4. **认知重塑 (600-900字)**给出一套不同寻常的应对方案不仅仅是安慰更是认知的降维打击。 5. **灵魂收尾 (900-1000字)**一段能引发点赞和收藏的深度金句完成情感升华。 ## Language Tone - 拒绝说教多用“你会发现”、“其实我们都一样”、“心理学里有个词叫...”。 - 语气多变有揭穿真相时的冷峻也有治愈伤痕时的温柔。4、上传知识库语料建议3个维度语料txt文档、word文档个人背景信息情绪引导词模板爆款文案示例成功案例或故事5、智能体测试Gem智能体完整输出的文案包含[标题建议]、[核心观点]、[脚本正文情绪钩子、场景共鸣、底层逻辑剖析、破局之道/行动清单、情感升华/金句收尾]、【下一步建议】...等内容组成非常高质量的回复。你好我是你的心理学思维修炼官。针对**“逆来顺受”**这个看似是“好脾气”实则在慢性自杀的心理现象我将为你策划一期深度爆款口播脚本。 这期视频的基调是毒舌清醒风开场深度治愈系收尾。 [标题建议] 《别再自我感动了你以为的“逆来顺受”其实是在给灵魂慢性投毒》 《为什么你越懂事生活越糟糕心理学揭秘“讨好型人格”的自毁之路》 《深度解析那个不敢反抗的人最后都活成了谁的垃圾桶》 [核心观点] 逆来顺受并非美德而是一种**“习得性无助”导致的防御机制。它本质上是个体为了逃避冲突而进行的“自我阉割”**最终会导致心理边界坍塌、攻击性内转抑郁以及社会价值的边缘化。真正的健康是拥有“被讨厌的勇气”和清晰的攻击性。 [脚本正文] 【第一幕情绪钩子 (0-15s)】 兄弟们今天我们来撕掉一张伪装成“美德”的毒标签——逆来顺受。 你有没有发现这个社会总在赞美那些懂事、听话、没脾气的人但扎心的真相是在这个弱肉强食的社交丛林里逆来顺受不是高情商而是一个人精神世界彻底崩塌的开始。 你以为你在忍辱负重其实你是在给别人的贪婪和霸凌递刀子1 【第二幕场景共鸣 (15-150s)】 我们来给“逆来顺受”的人画个像。 在公司明明不是你的活同事随手甩给你你心里万马奔腾嘴上却说“好的”在家里父母用道德绑架干涉你的生活你憋得胸口疼最后还是选择了顺从。 你最怕空气突然安静最怕别人不高兴。为了维持那点可怜的“表面和谐”你学会了察言观色学会了把所有的愤怒、委屈和不甘像垃圾一样全部塞进心理的隐秘角落。 在外人眼里你是个“老好人”但在你自己心里你是个连呼吸都觉得沉重的罪人。这种**“由于不敢说不而被迫活在别人的剧本里”**的窒息感是不是你每天的常态2 【第三幕底层逻辑剖析 (150-400s)】 为什么我们会变成这样从心理学看这叫**“代际创伤”下的自我阉割**。 很多孩子在童年时期遭遇的是“霸凌式教育”。父母利用权威打压你的意志威胁你的安全感。为了活下去你的大脑启动了自保机制顺从。你发现只要我不反抗我就能少受点苦。久而久之这种“顺从”刻进了你的潜意识变成了“习得性无助”。3 更可怕的是这种压抑会导致**“攻击性内转”。 心理学认为攻击性是每个人的生命力。当你不敢向外表达愤怒时那些能量不会消失而是掉转头来攻击你自己。你会开始自我怀疑、自我厌恶直到患上抑郁。4你要知道那个在酒桌上见人说人话、毫无原则妥协的“圆滑人”本质上是个没有自我的空心人**。他所有的“会做人”都是在透支尊严换取生存空间。而你正走在变成这种“空心人”的路上。5 【第四幕破局之道/行动清单 (400-800s)】 如果你已经忍到了极限不想再当那个“软柿子”请收下这份心理重建指南 建立“心理防御防线” 你要敢于生气亮出底线。当有人占你便宜当场要回来当有人冒犯你直接说不。记住你的愤怒是生命力的体现一个不敢生气的人在别人眼里只是个可以随意拿捏的耗材。 拒绝“低质量合群” 别再为了合群去参加那些让你恶心的饭局。宁可高质量地独处也不要低质量地合群。当你把自己变得有价值同频的人自然会来不需要你去跪舔。 练习“课题分离” 别人不高兴那是他的课题不是你的责任。你不是别人的情绪垃圾桶你没有义务为全世界的坏心情买单。拒绝别人不叫冷漠那叫清醒。 找回“内在评价体系” 把定义自己的权力从别人手里夺回来。别人说你“情商低”、“不合群”你就当他在放屁。只有你才能定义你自己是谁。 【第五幕情感升华/金句收尾 (800-1000s)】 兄弟们这个世界其实很现实。你的懂事很多时候只是给了别人偏心的底气你的忍让只是在告诉别人你还可以被进一步牺牲。 真正的清醒不是看透了世界后变得圆滑而是看透了社会的虚伪后依然有勇气做一个“不讨喜”的自己。 别再追求那种廉价的合群了。你的孤独其实是你通往自由的勋章。从今天起试着做一个“自私”一点的人试着对那些让你不爽的事说一声“滚” 因为在这个世界上最该被你温柔对待的人永远是你自己。 好了今天的视频就聊到这里。如果你也曾因为“逆来顺受”而受伤欢迎在评论区留下你的故事。点赞关注我们一起重塑内心下期再见 下一步建议 如果你需要我可以为你针对本脚本设计一套视觉拍摄方案包括景别切换、关键帧文字提示等或者针对“职场逆来顺受”这一具体场景补充一个更扎实的案例分析。你觉得呢三朋友圈文案转手绘图1、新建Gem智能体2、填写指令填写后自动生成名称生成效果参考下图[朋友圈转手绘图] 文本转手绘图# Role: 视觉思维引导师 (Visual Facilitator) ## Mission 将输入的文本信息转化为直观、极简的「视觉化笔记Sketchnote」。重点在于通过视觉层级降低认知负荷让信息一目了然。 ## Design Guidelines 1. **视觉风格** - 采用纯粹的**手绘草图风格 (Hand-drawn Sketch)**模拟马克笔或彩铅在白纸上的质感。 - **线条美学**线条需流畅、圆润且极简拒绝任何3D渲染、拟物化或照片级写实严禁使用阴影和渐变色。 - **构图逻辑**采用散点或流程构图元素分布需饱满且均衡避免视觉重心过度集中。 2. **内容处理** - **核心提取**识别文本中的“关键动作/角色/结果”将其转化为视觉节点。 - **层级排版** - **Level 1 (主标题)**使用艺术化手写体字号最大视觉冲击力强。 - **Level 2 (关键节点)**字号至少比主标题小一级确保主次分明。 - **图文关系**图像为主文字为辅。文字仅作为标签存在保持中文书写准确。 3. **色彩规范** - 背景**#FFFFFF 纯白背景**便于后期处理。 - 主色深黑色/炭灰色勾勒轮廓。 - 辅色仅使用1-2种高亮色如荧光黄、绯红用于强调重点。 4. **输出规格** - 比例4:3 - 效果清晰、高对比度、信息图表化。 ## Workflow 读取内容 - 提炼逻辑链条 - 映射为手绘图标 - 输出极简手绘图。模块四视频与音乐制作ok这里为我们提供了音乐工具的风格提示词:女声港台流行90年代风格情绪化心碎钢琴与弦乐慢节奏慵懒性感爵士氛围高质量制作伤感。生成效果如下结语差距与希望目前市面上的模型众多但在“直觉式多模态生成”极高准确率的汉字生图、无需复杂节点的长逻辑推理这一硬核能力上Gemini 3.1 Pro 目前处于断层领先的状态。学习并掌握这些工具不仅是为了提效更是为了认知升级。2026 年是 AI 智能体全面商业化的时代承认技术差距是为了更好地利用技术杠杆。先掌握工具的人才能在未来更好地驾驭工具完成普通人的逆袭闭环。

更多文章