1. 文本大模型 (Text LLM)
- 首选 (最强全面):Gemini
- 理由:上下文最长,多模态跑分第一,Gemini 2.0 Flash 目前免费。
- 平替 (全能体验):豆包 (Doubao)
- 开源推荐:通义千问 (Qwen)
- 其他: ChatGPT、Grok、DeepSeek、Claude、Kimi。
2. 图像生成 (Image Generation)
- 首选 (王者级别):Nano Banana Pro
- 理由:原生多模态,画面一致性极佳,编辑便捷,质感行业顶尖。
- 平替 (高性价比):即梦 (SeeDream) 4.5
- 理由:背靠抖音数据库,出图非常有“网感”,拿来做自媒体配图和封面非常合适。人物/主体一致性很强,可拿去制作连载故事/漫画
- 开源推荐:Z-image
- 理由:6B小参数能跑出不输给闭源模型的效果,适合需要快速大量出图进行思路验证的场景。
- 其他:Mid-Journey, Flux
3. 视频生成 (Video Generation)
- 首选 (生产力级):Veo 3.1
- 理由:镜头和视频质感最符合电影影视标准,还自带与画面高度匹配的原生音频
- 平替 (性价比高):Seedance 1.5 Pro (即梦里叫视频3.5 Pro)
- 理由:对话表演自然,口型精准,表情与配音高度同步。音画同步能力表现好
- 开源推荐:万象 Wan 2.2
- 理由:在消费级显卡上也能跑出 1080p 的高清长视频。适合追求极高定制化的个人创作。
- 其他参考:Vidu、Higgsfield、Pika、Luma、可灵、海螺AI、Runway Gen。
4. 音频与音乐 (Audio & Music)
- 配音首选:MiniMax
- 理由:超低延迟,支持多语言无缝衔接,最独特的是可以通过纯文字描述来“捏”出你想要的声音,更适合实时场景。
- 开源推荐:IndexTTS2
- 理由:情感和音色都很细腻,能对生成的语音时长进行秒级控制,让语音完美匹配画面进度,配音神器
- 配音平替:ElevenLabs
- 音乐首选:Suno
- 音乐进阶:Udio
- 音乐配乐:Stable Audio
- 理由:纯音乐/音效最快最好,背景音乐的专业工具。如:游戏/影视配乐、播客/视频开场的音效
5. 数字人 (Digital Human)
- 首选 (效果最稳):HeyGen
- 平替/开源:Infinity Talk
- 其它:Synthesia、Multitalk
6. AI 浏览器 (AI Browser)
- 首选 (体验最佳):Dia
- 理由:UI界面好看,响应速度快。Skills自定义功能强大。可跨应用完成部分自动化任务,隐私性强
- 其他推荐:Atlas
- 理由:专为 GPT 用户优化(目前主要为 Mac 版)。
- 国内平替:豆包 / 夸克
- 理由:自带免费 AI 插件,习惯后难以回到普通浏览器。
7. 编程开发 (AI Coding)
- 首选 (无可撼动):Cursor
- 平替 (更实惠):Trae
- 理由:细节做得好,即使是非程序员用来辅助写作也非常舒适。
- 进阶: Claude Code、CodeX、Google AI Studio。
8. 个人/企业知识库 (Knowledge Base)
- 首选 (学习神品):NotebookLM
- 理由:Google 出品,能将海量资料一键转化为音频、总结或问答。
- 平替:腾讯IMA
- 深度嵌入微信生态,使用门槛极低,聊天记录、群文件、公众号文章都能一键存入和智能检索。
- 企业级推荐:飞书 (Feishu)
- 理由:集成了 Agent、知识库和 IM 的未来办公形态。
9. 通用 Agent 与自动化 (General Agent)
- 首选:CodeX (直接作为通用 Agent 使用)
- 平替:AutoGLM、扣子空间
- 自动化工作流:n8n
Refer:https://ai.feishu.cn/app/P8z3bqEa8aRpFxsV20wcWYFRnQb