第 5 / 8 节·15分钟
AI 是怎么工作的?(不用看公式)
🚗不需要懂技术细节
你开车不需要懂发动机原理,用 AI 也不需要懂算法。但了解基本原理会让你用得更好。
大语言模型的核心原理
ChatGPT、Claude 这些产品背后的技术叫做大语言模型(LLM)。
它的工作原理其实很简单:
预测下一个词
就这么简单。
举个例子
你输入:"今天天气真..."
AI 会计算每个词的概率:
"好" — 60%
"不错" — 25%
"糟" — 10%
选一个高概率的词,接着预测下一个...如此循环,形成完整回答。
为什么它看起来这么"聪明"?
📚因为它读了几乎整个互联网
维基百科
新闻文章
书籍
论坛讨论
代码仓库
学术论文
通过海量阅读,它学会了人类语言的规律。
几个关键概念
🧩
Token(词元)
AI 处理文字的最小单位。一个中文字约 1-2 个 token。AI 有长度限制,超长文章可能处理不了。
🧠
上下文窗口
AI 一次能「记住」多少内容。就像短期记忆有限。现在的模型可以记住几十万字。
🌡️
温度(Temperature)
控制回答的创造性。温度低 → 更确定保守;温度高 → 更随机有创意。
理解原理后,你会明白
💡4 个关键认知
- 🤥 为什么 AI 会"胡说八道" — 它只是在预测"最可能的下一个词",不是在查事实
- 😵 为什么对话越长回答越差 — 上下文窗口有限,信息太多会"忘记"前面的
- 🎲 为什么同样的问题答案不同 — 每次预测都有随机性
- 🌐 为什么它不能上网 — 除非特别设计了联网功能
了解原理不是为了变成技术专家,而是为了更聪明地使用 AI。就像了解汽车有刹车和油门,你才能开得更好。