人手几个 AI工具已经是共识了,但我们与 AI的每次对话,无论是中间产物,还是最终答案,其实都可以由AI帮你整理成适合发小红书、公众号,头条,推特的内容。

1、永远用最好的AI产品/模型。每个领域只用最好的1-2个模型,最好的就是最便宜的,能节省大量的时间和心智。永远用现成的最好的AI解决方案,只需要半天就能跟上AI的最新发展,完全不用担心掉队。
2、安心做个“等等党”,如果你不是科研人员,没有任何必要去研究AI内部的实现逻辑和优化方案,遇到AI解决不了的场景,等着就行。你觉得难以实现的能力通常等半年大模型自身就解决了,比如LLM的数学计算能力、AI绘画画不对手指的问题、AI视频运动幅度小等等。半年后,Agent能持续工作一整天甚至更长,也不是没可能。
3、要开始考虑与AI竞争和共存的问题了。2022年11月的GPT 3.5很难写出能运行的单个文件,2025年11月的Opus 4.5能完整写出几十个文件的中型项目,3年的进步速度不止百倍,高薪程序员的职业都能被AI替代,你的职业为什么不能?
所以,老板为什么要雇你而不是雇AI?为什么要雇你而不是其他人来操作AI?甚至再远一点点考虑,如果AI员工普及了,你有没有能力和商业模式,能经营一家员工全是AI的公司?
目前最前沿、最值得用的AI产品/模型(2026年2月)

Claude Code
简称CC,所属公司是Anthropic。Claude Code是软件,软件里默认使用的模型是Claude系列LLM模型,包括Claude Opus 4.6、Claude Opus 4.5、Claude Sonnet 4.5等。你可以理解为Claude Code一辆汽车,里面的LLM模型是驾驶员,驾驶员可以换成国产的Kimi K2.5等模型。
Claude系列有这几个产品:
Claude Code:面向程序员的AI编程工具,但能力不限于编程,能结合MCP、Skills完成各种工作任务,是本地使用的最佳AI智能体。命令行界面,没有UI界面,非程序员用不习惯。
Claude桌面端:Claude对话的客户端版本,里面有个Code标签页,可以用UI界面使用Claude Code。
Claude Cowork:专注于通用任务的Claude Code改编版,更适合非程序员使用。
如果你是程序员,推荐购买100美元/月的Claude订阅,性价比最高。
Codex APP
ChatGPT大家肯定都听过,OpenAI旗下的,AI帷幕就是由他拉开的。但是现在我更推荐使用OpenAI的Codex APP,这是对标Claude Code的AI智能体,不仅能写代码,也能完成日常工作任务,MCP、Skills也都是可视化管理,非常适合普通人使用。后续会写一个面向非程序员的教程,来教大家如何融入办公场景。
如果你每个月只有20美元,那么我建议订阅ChatGPT,可以用ChatGPT、Codex APP/CLI、GPT Image 1.5、Sora2等全方位的模型和产品,虽然可能都不是最顶尖的,但也是一流的,性价比最高。
Gemini 3 Pro
俗称“哈基米”,Gemini模型最大的强项是多模态,用来分析图片、视频、语音,以及写用于生成图片、视频的提示词特别好用。Gemini 3 Pro如果要用于写代码,最好只用于写前端,而且最好只写第一版,Gemini的前端审美最佳,但是指令遵循和复杂任务的执行,比不上Opus 4.6和Codex 5.3。可以在AI Studio或者Gemini官网免费使用。
Nana Banana Pro
俗称“大香蕉”,Banana Pro是目前最强的AI绘画模型,而且这不止是一个绘画模型,是一个集绘画和LLM为一体的世界模型。能应用在设计、电商、PPT、教育等凡是跟图片有关的所有领域。另外可以用的模型是Midjourney,Midjourney的美学目前还是独一份,可以用来生成美学图片给Banana Pro,结合着用。
Seedance 2.0
字节新出的AI视频模型,目前最强,相比之前的AI视频模型,最大的提升是运镜和镜头切换,让AI生成的视频具有了专业导演的镜头语言。AI影视和AI漫剧即将迎来重大变革,之前搭的工作流基本都没什么用了。凡是跟视频有关的领域,都可以用的上Seedance 2.0。
Suno 5
最佳AI音乐模型,Suno生成的音乐已经遍布各大视频和音乐平台了。
TTS(文本生成语音)
绘画、视频、音乐都有一个遥遥领先的模型,TTS里目前没有,付费的11Labs、Minimax Hailuo很不错的,开源的Index-TTS-2、Qwen3-TTS也非常好,尤其是Index-TTS-2的音色克隆和情感控制,有非常大的可控性。
ASR(语音识别)
即使是中文语音识别,目前最好的也是Gemini 3 Flash和11Labs,尤其是Gemini 3 Flash有能力把每个字的时间标注出来。不过好在语音识别现在很成熟了,各个模型都有比较高的准确率,豆包语音输入法、微信语音输入法也都很好用。
OCR(文字提取、图片转文字)
目前最好的也是Gemini 3系列,Gemini 3 Pro和Gemini 3 Flash都有很高的识别率,开源的推荐百度的PaddleOCR-VL 1.5,模型又小又好用。