#001 · 研究生 · 决策理论/心理物理学
陆长骅 老姜头

守夜人的眼睛

信号检测论 · Signal Detection Theory · 2026-06-07

这个故事里不会有任何学术术语。读到结尾之前,你不会知道它在讲什么。

陆长骅是在七月的第三个夜里感觉到不对的。

塞外的风裹着沙,打在城楼的砖墙上,发出细密的声响。他裹紧羊皮袄往东段走,满月把戈壁照成一片惨白。他搓了搓食指侧面——这是他脑子转不过来的老毛病。

"有什么情况?"

小个子哨兵没回头:"三更前后,东北方向,两次一闪一闪的。像火又不太像。"

旁边老姜头靠着墙垛,烟杆叼在嘴里,烟锅早灭了。

陆长骅看了看东北——什么也没有。

但他心里不踏实。这三个月来,小个子报了太多,老姜头报得太少。两个人守同一面城墙看同一片夜空,报上来的东西南辕北辙。

···

上个月的记录他翻了不下十遍。小个子报了十二次"可疑火光"——十一次假的,一次真的。老姜头呢,一次没报。可粮草官偏就被劫了——城外二十里的补给的队伍,青天白日让人端了。

把总拍着桌子:"你的人有问题。虚报太多浪费兵力,形同虚设。调一调。"陆长骅调了。先找小个子:"盯久一点再说。"头几天报得确实少了——但陆长骅觉得他反应慢了,以前火一闪就绷紧,现在先犹豫。又找老姜头:"多留个心眼。"老姜头报了几次——陆长骅亲自去看过,屁也没有。最后把两人防区对调——第一晚,小个子在对面报两次假的。老姜头在西边一夜无话。

问题不跟位置走。问题跟人走。

···

陆长骅在城墙上来回踱。戈壁滩上一丛骆驼刺在风里摇,影子像一个人蹲着。他盯着看了很久——就是丛骆驼刺。但他真切地感到自己正在做决定:决定这丛刺"不值得报告"。这个判断来自他当兵五年的经验。可自己刚到镇北台那会儿呢?会不会也为这样一丛刺紧张过?

会的。后来慢慢不紧张了。那小个子是不是正处在"什么都紧张"的阶段?老姜头处在"什么都不紧张"?但老姜头不一定对。小个子不一定错。

···

三天后来了个退役的百户长——魏爷,年轻时在辽东守了三十年墩台。陆长骅端了碗热酒过去聊起人手的事。

魏爷抿了一口酒:"你那个报得多的,报的有没有真货?"

"十一次假的,一次真的。那一次不是真货粮仓就没了。"

"你那个报得少的,他刚来的时候也不报?"

陆长骅愣了一下。老姜头说他十六岁在大同就开始当差了,从来就没什么好报的。

魏爷站起来走到窗边,指着城外:"那个影子,石头还是人?"

"石头。用了三息确定。"

"你那个小个子呢?"

"他一息就决定了——是人。然后半炷香后发现是石头。"

"老姜头?"

"他看了一眼,不需要决定。根本不值得看。"

"他们看到了三样不同的东西?"

"不。看到的东西是一样的。"

"那结论为什么不一样?"

陆长骅张了张嘴,说不上来。

"因为每个人需要一定程度的'确定'才愿意说'有',"魏爷说。"你用了三息,小个子一息,老姜头不需要——你们心里的那条线画在不同的位置。"

魏爷从怀里摸出一张泛黄的纸,上面画着两条曲线,一部分叠在一起。"辽东一个识旗的老兵画的。他说风声和敌音不一样——但有时候风声听起来像敌音。左边是风声,右边是真的敌音。有一部分,你分不出来。

"你要在某个地方画一条线。画太左,你虚报多。画太右,你漏报多。你无法消除虚报和漏报——你只能选择在哪里平衡。"

这就是 信号检测论(Signal Detection Theory)。任何一个"是/否"判断里,藏着两个独立的东西——你的分辨力和你愿意冒多大风险才说"是"。

···

天快亮的时候老姜头端了两碗热茶来。

"我十六岁在大同,头一年报了二十七次疑火。没一次真的。"他喝了一口茶。"后来就不报了。"

陆长骅忽然懂了。问题不是老姜头"标准太严",是他把标准调得太严了——严到他自己都不知道已经调过了头。小个子是把标准调得太松。但没有谁能说哪个是对的。

这世上没有一条完美的线。只有你在哪里画下它,和你是否知道它在那里。

#002 · 研究生 · 决策理论/最优化
苏慕念 江不周

不后悔的买卖

最优停止理论 · Optimal Stopping Theory · 2026-06-07

这个故事里不会有任何学术术语。读到结尾之前,你不会知道它在讲什么。

苏慕念在第三个摊子前站了很久。

这是镇上一月一次的集,卖山货的摊子一共七家。她要买一对品相好的鹿茸——陆长骅摔伤了腿,老姜头说鹿茸泡酒管用,赶不上这趟就得等一个月。

第一家,鹿茸片薄但发白。她没说话,站起来走了。第二家,成色好一些,但左边那支根部的切面有裂。她又走了。第三家——鹿茸形正、色润、切片厚薄均匀。摊主是个四十来岁的老猎户。苏慕念在光下照了照切面。很好。比前两家都好。

但她没有掏钱。

···

"还不买?"江不周不知道什么时候站到了她身后,嘴角带着那副"你这不对吧"的弧度。

"再看看。"苏慕念说。

"你已经看三家了。这家最好。"

"后面还有四家。"

"万一后面不如这家呢?你回头,人家已经收摊了。"老猎户确实已经在收拾东西了。

"再看看。"苏慕念说。

···

第四家,形好但偏小——她没拿起来就走过去了。第五家,没有鹿茸。第六家,切面颜色均匀得过分离谱——染过的。第七家在最边缘,鹿茸只有一对,形不正,右支弯曲,纹理有点乱。

往回走经过第三家——老猎户已经走了。地上空了。

江不周没说话。苏慕念站在空摊前。"……早了。第三家就是最好的。我知道。"

"那你当时为什么不买?"

苏慕念没有回答。手指在袖口里画了一个圈。她自己也不知道。

···

往回走的路上,江不周终于忍不住了:"你第三家就看上了,后面看了四家——没有一家比那家好。你明明知道它是!"

"万一呢?"

"万一什么?万一有更好的?结果呢?"

苏慕念站住了。她站在那里,站在集市末尾的土路上——如果第三家确实是今天最好的,她需要看到第几家才能确定这一点?答案是:全部。只有看到全部七家,她才能确定第三家是最优的。可到那时候,第三家已经不在了。

···

晚上她坐在茶馆里,面前一碗茶凉透了也没喝。陆长骅拄着树枝拐进来,看见脸色就知道没买到。她把今天的事说了一遍。"不周说我不做决定是不敢——但他只说对了一半。我不怕做决定。我是怕信息不够。没有看完怎么能确定是最好的?"

陆长骅搓了搓食指侧面:"那得看多好才算好。如果不是最好的一个,而是足够好——你还需要看完所有吗?"

···

第二天一早,苏慕念去找了江不周。"昨天你说我的问题是不敢做决定。不全对。我的问题是我要看到全部才能决定。但全部看不到。我追求的不是足够好,是绝对最好。如果你追求绝对最好——你一辈子都在等。"

那不是直觉能回答的问题。但它有一个数学答案——最优停止理论(Optimal Stopping Theory),其最著名的形态是秘书问题(Secretary Problem)

当你必须在不知未来选项的情况下依次做选择,最优策略是:拒绝前 N/e 个候选(约37%),然后选第一个比之前所有都好的。这不是经验法则——它有严格的数学证明。

苏慕念听完没有点头。她沉默了很久,手指在膝盖上画了三圈——然后说了一句不是总结的话:"所以问题不是我需要看完全部——是我没给自己设一个停止规则。"

最优停止理论 Optimal Stopping Theory

在不知未来选项的情况下,最优策略是拒绝前37%的候选用于校准标准,然后选择第一个超过该标准的选择——此策略选中全局最优的概率始终保持约37%。
Gilbert & Mosteller (1966) "Recognizing the maximum of a sequence." Journal of the American Statistical Association, 61, 35–73.

Ferguson (1989) "Who solved the secretary problem?" Statistical Science, 4(3), 282–289.
#003 · 研究生 · 统计学习理论
陆长骅

偏差-方差权衡

Bias-Variance Tradeoff · 2026-06-07(Marvis版本)
#003 偏差-方差权衡 由Marvis版本生成,full content暂未同步至当前artifact。概念核心:

任何模型的预测误差可分解为三部分——偏差(bias)、方差(variance)和不可约噪声。偏差是你假设错了形状,方差是你对数据太敏感。两者此消彼长:你越想把曲线拟合得跟数据点严丝合缝(降偏差),你的模型就越容易因为换了几个数据就大翻盘(升方差)。

故事背景:陆长骅学射箭,发现瞄得越准、动作越精细,反而越容易因为一阵风就脱靶——太精准的模型反而脆弱。

偏差-方差权衡 Bias-Variance Tradeoff

预测误差 = 偏差² + 方差 + 噪声。模型越复杂,偏差越低但方差越高;模型越简单,偏差越高但方差越低。最优模型在两者之间平衡,而非追求任何一端的极致。
Geman, Bienenstock & Doursat (1992) "Neural networks and the bias/variance dilemma." Neural Computation, 4(1), 1–58.
#004 · 研究生 · 概率论/随机过程
陆长骅 老姜头 许燃

到头了

鞅收敛定理 · Martingale Convergence Theorem · 2026-06-08

这个故事里不会有任何学术术语。读到结尾之前,你不会知道它在讲什么。

陆长骅站在自己做的箭垛子前面,看了很久。

两百多支箭插在草靶上,箭尾的羽色从浅到深——每一批换一种颜色。最浅的那批歪得像喝醉了酒,越往后越正。但最新那批和最前面那批之间,差得越来越小了。最新一批的箭杆挺直、箭羽齐整、箭簇打磨得锃亮——射出去,还是偏那么一寸。不多不少,正好一寸。

他搓了搓食指侧面。

老姜头从后院走进来,指背轻轻碰了一下箭杆,什么也没说。

···

陆长骅的目标是做出一支完全不偏的箭。

这句话他说了四个月。头一个月他连箭都做不直——桦木杆削出来粗细不匀,射出去自己能飞偏三尺。第二个月能做了,但箭羽绑不稳。第三个月箭杆直了,箭羽稳了,箭簇也磨得对称了——但射出去,那尾羽还是抖。

他试了所有能想到的办法。

第一种办法:从源头改材料。

他把箭杆从桦木换成柘木——柘木硬,密度均匀,比桦木贵了三倍。头一批柘木箭出来,他搭弓射了一箭。箭带着风声出去,扎进草靶——偏了半寸。

半寸。

比桦木好了不只是一点半点。他高兴了三天。然后做了第二批柘木箭,跟第一批比——偏了差不多也是半寸。他又做了第三批——还是半寸。材料换了,天花板也换了,但天花板还是在。

第二种办法:精调搭配。

他开始记参数。每支箭的羽毛偏转角、箭簇重量、箭杆的弯曲度、绑羽的线距。他做了十四组组合,每组射五支,量偏差距离记在本子上。十四组数据摊了一桌子,墨迹密密麻麻。

最好那组和最差那组差了一截——但最好那组跟柘木批次平均比,几乎一样。他对着那堆数据,一支一支翻过来翻过去地看。不管怎么调参数,都到不了那个"完全不偏"的坎。参数组合变了,结果在那条线附近浮动——上不去,也下不来。

第三种办法:请教老手。

隔壁镇有个姓陈的猎户,听说射箭是一把好手。陆长骅拎了一壶酒过去,想看看人家怎么做箭。陈猎户也不藏私——拿出来给他看。材料就是普通的柘木,工序跟他差不多,做得还比他慢。陆长骅要买一支回来拆——猎户说不卖,自己做的自己用。

陆长骅回来的时候手里捏着那支箭,是他在猎户院里射过的。翻来覆去地看——跟自己的箭比外表,没有能看出来的差别。但射出去就是比他稳。

他把那支箭和自己的最新一批并排插在靶子上。左边的陈猎户箭,右边他最好的箭。靶心是同一个位置,偏的方向不一样,偏的距离——差不多。

他盯着看了很久。不是人家的箭更好。是他的箭也没差到哪里去。问题是"差不多"不是他的目标。

···

许燃路过箭铺的时候,陆长骅正坐在门口的石头上,面前摆了三堆箭。

"你这是在干什么?"许燃话没说完已经蹲下来了。

"做箭。"

"做这么多?"她随手抄起一支浅羽的旧箭,搭弓射了一箭。箭飞出去,尾羽晃了两晃,偏了大约两寸。又拿起一支深羽的新箭——偏了大约一寸。

"这不进步了吗?"

"进步太慢了。"

"那你想要多快?"

陆长骅说不上来。许燃看了他一眼,撸起袖子:"我也试试。"她没用两个时辰,按自己的理解做了十支箭——用的就是陆长骅剩下的柘木,一样的工序,连工具都一样。射出去——跟陆长骅最新的那批几乎一样。

陆长骅把许燃的箭和自己最新那批并排插在靶子上。十支对十支。从靶心看,像是同一批——偏差都在一寸上下。没有人能分出哪十支是谁做的。

老姜头走过来,指背轻触了许燃那支箭的箭头,摸了一下又放下。

"你这一批,和上一批,和上上一批——中间差了多少?"老姜头问。

···

陆长骅把三个批次的箭在石台上排开。桦木偏两寸。柘木第一批偏快一寸——从两寸到一寸,进步了一寸。柘木第二批偏大半寸——从一寸到大半寸,进步了不到三分之一寸。柘木精调那批偏半寸多——从大半寸到半寸多,进步了薄薄一层。

不是每次进步都一样大。是每次的进步本身就比上一次小。

"你注意到没有,"老姜头蹲下来,从地上捡起一支桦木旧箭,"你第一次换材料,进步了一寸。第二次精调,进步了三分之一寸。第三次……你自己都测不出来了吧。"

许燃在旁边吹了声口哨。

陆长骅没有说话。他盯着石台上那三排箭——偏差在缩窄,但缩窄的速度本身在变慢。第一次的进步是第二次的三倍,第二次的进步是第三次的五倍。

他站起来,拿了一支最新批次的箭,搭弓——拉到满,盯着七十步外的草靶,慢慢地,慢慢地放开了弦。

箭飞出去。偏了。还是那个差不多的位置。

···

他坐在石台上,一直坐到太阳落山。许燃走了,老姜头也走了。院子里只剩他一个人和两百多支箭。

他在心里把所有尝试过的方法过了一遍——每一批的偏差数字在脑子里排成一条线,越来越密地聚在同一个区间里。不是"还能更准",是"在这个方法的框架下,这就是你能到的最好的了"。你再怎么调,参数再怎么换,它都不会再往前走了。

因为他每次调的依据都是上一批的结果——看上一批偏多少,然后往反方向调一点。这是最合理的做法,也是最自然的做法。但这个做法本身有一个隐含的前提:每一个微调都会带来等量的改善。

可现实不是这样的。改善本身在衰减。

他忽然想到了一个词。不是在书上看过的,是他自己在脑子里冒出来的——到头的尽头。每一次调整的依据都是上一次的结果,而上一次的结果已经无限接近那个"你在这个工具、这个材料、这个方法下能到的极限"了。后面每一次改进的幅度,都只取决于"你离极限还有多远"——而那个距离,每次都在减半。

他做不出完全不偏的箭。不是他不够努力。是这件事——在这个做法下——根本到不了。

···

老姜头从后院走出来,手里拿着一根不太像箭的东西——一根被河水冲得光溜溜的柳条,随手削了削尖头,尾部绑了三根野鸡毛。没有打磨过的箭簇,没有量过角度的箭羽,没有称过重量的箭杆。老姜头搭弓,拉满——放。

柳条穿过七十步外的草靶,钉在木桩上,尾羽在微风里轻轻颤了一下——不动了。

陆长骅站起来走过去。那支柳条钉在木桩里,入木三分。他试着拔了拔,钉得很深。

"你没做它。"

"嗯。"

"你只是捡了它?"

"因为它是箭。"老姜头说。"不是'做出来的箭'。是'本来就是的箭'。"

陆长骅站在那支柳条面前,站了很久。

他忽然懂了。他不是输在"做得不够多"——他是输在不知道"什么时候该停"。每一次微调都在缩小差距,但每一次缩小的幅度本身就在告诉他一件事:这条路正在走完。真正的选择不是继续调下去——是承认这个极限,然后问自己一句:你要不要换一条路?

灯火亮了。他把石台上三个批次的箭收进箭筒,那支柳条还钉在木桩上。

他没拔它。留着。

鞅收敛定理 Martingale Convergence Theorem

若一个鞅的期望绝对值有界,则该鞅几乎必然收敛于一个极限。通俗地说:当你的每一步调整只依赖上一步的结果、且调整幅度本身在持续缩小,你的最终位置必然收敛到某个天花板——不再取决于你有多努力,只取决于你出发时选的那条路本身的上限。
故事元素概念对应
陆长骅的箭偏了一寸,怎么调都到不了"完全不偏"收敛极限——路径决定了你能到的最远位置
桦木→柘木:进步一大截;精调:进步一小截;继续调:几乎不可测量期望增量递减——每步改进幅度本身在衰减
每次调校基于上一批的结果鞅的马尔可夫性(下一步只依赖当前状态)
偏差缩窄速度在放缓收敛速度——且随着接近极限而趋于零
老姜头的柳条箭——换了路径跳出鞅结构——重新定义过程本身
"到头的尽头"——陆长骅自己的感悟鞅收敛的含义:路径收敛是结构性的,不是人力可违
"我不是输在做得不够多——是输在不知道什么时候该停。"
#005 · 研究生 · 行为决策理论/行为经济学
陆长骅 苏慕念 江不周

三碗骰子

埃尔斯伯格悖论 · Ellsberg Paradox · 2026-06-09

这个故事里不会有任何学术术语。读到结尾之前,你不会知道它在讲什么。

···

陆长骅是在风陵渡的渡口酒肆里注意到那三只碗的。

河风裹着泥沙和烧酒的气味灌进门来,一群等渡的人围着张矮桌,不喝茶也不聊天——眼神全拴在一只黑碗上。店家坐在桌后,面前摆了三只黑碗,碗底各扣一颗骰子。

"左边这颗,六面骰,三面红三面黑,谁都知道。"店家拍拍左碗,又拍拍中碗。"中间这颗,一样。三红三黑。"

他的手掌落在右碗上,停了一下。

"右边这颗——没人见过它全貌。也许全是红,也许全是黑,也许是四红两黑,也许别的颜色。没人知道。"

他宣布规矩:选一只碗,开盅,红色就赢,十文一注。

陆长骅搓了搓食指侧面——这是他脑子转不过来的老毛病。因为他看到一个奇怪的事:所有人都在左碗和中碗下注,右碗面前空空荡荡,一只铜板都没有。等了半炷香,还是没人碰。

···

"不对吧。"江不周不知什么时候站到了他旁边,挑起眉毛,往后一靠。"三个碗期望值不一样吗?"

"一样。"陆长骅说。"左右中,都是三红三黑——第三颗虽然不知道,但不知道不代表不是。所以期望值一样。"

"那他们为什么不押第三个?"

陆长骅说不上来。

店家显然也注意到了。他清了清嗓子:"右碗今日加码——赢了翻倍,二十文。押不押?"

安静。还是没人挪窝。

江不周的眉毛挑得更高了。"双倍赔率还不押?这些人是不是——"

"不是。"苏慕念的声音从角落传来。她坐在靠窗的位置,面前一碗凉茶,目光落在人群和矮桌之间的空处,手指在桌沿画圈,一圈两圈——她没看他们,但她一直在看那三只碗。

"他们不是没算过这笔账。"苏慕念说。"他们算过了,才不押的。"

···

第一种办法:算账。

陆长骅借了张草纸,在上面画了三只碗的收益图。左碗和中碗:五成胜率赢十文。右碗:未知胜率赢二十文。就算右碗胜率只有三成,期望值也跟左碗持平——低于三成才亏。而右碗的实际胜率很有可能高于三成(毕竟它理论上可能是全红)。

"你们看,"他把草纸推到路人面前,"右碗的期望值至少不低,也许更高。为什么不押?"

路人看了一眼草纸,又看了一眼右碗。

"你说得有道理,"他说,"但我还是押左碗。"

陆长骅试了十几个人。每一个都承认他的账算得对。每一个最后还是押了左碗或中碗。

他对着那张草纸发愣——账算清楚了,没人听。

···

第二种办法:以身示范。

陆长骅从怀里摸出十文,拍在右碗旁边。

"我押。"

店家开盅。右碗的骰子露出来——暗红色的那一面朝上。红。赢了。

他又押。连押十五把。赢了八把,输了七把。五成三分——很正常。他把赢来的铜板在桌上码了一排,亮闪闪的十六枚。

"看见没有?"他说。"右碗能赢。"

围观的点点头,说"兄弟你手气好",然后继续押左碗和中碗。

他把十六枚铜板收回来——赢了,但没人因为他的赢而改变自己的选择。他忽然意识到:问题不是"能不能赢"——这些人从不怀疑右碗"有可能赢"。问题是他们就是不想碰它。

···

第三种办法:查根底。

陆长骅决定搞清楚右碗的骰子到底是什么。

他趁店家转身给客人倒酒的时候,伸手去掀右碗——手指刚碰到碗沿,店家就回过头来了。没有发火,只是把右碗拿起来,递到他面前。

"想看?给你看。"

骰子躺在店家的掌心里。一颗很老的骰子,骨质的,表面被磨得油润发黑,刻痕几乎要平了。陆长骅凑近了看——确实看不出颜色。不是故意不让人知道。是这颗骰子用了太久,久到没人记得它原来长什么样。

"它从我爷爷那辈就在了,"店家说,"没人知道它几面红几面黑。但有一个规矩:它从不坏规矩。"

"什么规矩?"

"你玩久了就知道。"

陆长骅把骰子翻来覆去看了很久。什么都没看出来。他把骰子还回去的时候,感觉自己输了——不是输给店家,是输给了一颗三句话都说不清楚的骰子。

···

风陵渡的夜里很吵。河水声、渡口的吆喝声、酒肆里喝多了的划拳声——但陆长骅一个人坐在渡口的石阶上,脑子里全是那三只碗。

他不是没有赢。他赢了。账他也算得清清楚楚,道理他也讲得明明白白。可他就是没办法让一个人去押那只右碗。

苏慕念从酒肆里出来,在他旁边坐下。她没说话。陆长骅也没说话。两个人就这么坐着,看河水在月光下反光。

过了一会儿,苏慕念站起来,拍了拍裙子上的灰:"明天你帮我一个忙。"

"什么忙?"

"借我三颗一模一样的骰子。"

···

第二天一早,苏慕念在酒肆门口摆了张桌子。

三只黑碗。三颗一模一样的骰子——都是三红三黑,都是一样的骨料、一样的刻法、一样的大小。

但第三只碗的碗底贴了一张纸片。纸片上写着两个字:"未知"

"来猜?"苏慕念说。"跟昨晚一样的规矩,一碗十文。"

人群围过来。有人押了第一碗,有人押了第二碗。第三碗——没人动。

陆长骅盯着那只碗底的"未知"两个字看了很久。

"你疯了,"江不周在旁边说,"里面的骰子明明是一样的,只不过碗上写了两个字——"

"对啊。"苏慕念说。

"——他们怎么可能——"

"你看。"

江不周沉默了。

第三碗面前站了差不多六十个人。一个押的都没有。三颗一模一样的骰子,一张纸片,两个字——就改变了所有人的选择。

苏慕念把第三只碗拿起来,撕掉纸片,露出碗底。"刚才这碗里是什么骰子?"她问旁边一个围观的人。

"跟那两只一样的吧……你不是说了吗。"

"那你刚才为什么不押?"

那人张了张嘴,没说出来。

苏慕念没有追问。她把纸片揉成一团,放在桌上。"这张纸,从没碰过骰子。但它比骰子更管用。"

···

陆长骅把那团纸片展开,展平,在桌上来回地看。

他忽然明白了。

不是算账的问题。不是能不能赢的问题。甚至不是那颗老骰子到底长什么样的问题。

问题藏得比这些深。

他回想昨晚那些押左碗输了的人——输了,笑笑,拍拍手。有人还自己打趣:"手气不行。"然后继续押下一把。

他又回想少数几个试了右碗的人——输了之后的脸色,不一样。没有那么坦然。有人会说"我就知道",有人说"这东西有鬼"。

同样的十文钱。同样的输。感觉不同。

因为押左碗输了,你心里有一个解释:"我选了一个五成的局,输赢都正常。"押右碗输了,你没有解释。你不知道它的概率,所以你连"为什么输"都不知道。你不知道自己是被运气打败的,还是被一颗全黑的骰子打败的——你不知道该归咎于谁。

人不怕输。人怕的是输了之后,找不到原因。

苏慕念把那三个碗并排放在桌上。"你看这三只碗里的骰子——其实你一个都看不见。都被碗扣着呢。但你觉得前两个你能看见——因为你'知道'它们是什么。第三只你承认看不见。就是这个'承认',让它们不一样了。"

她顿了顿。

"不是碗不一样。是这两个字有重量。"

···

三只碗并排摆着。陆长骅看着它们,忽然觉得这三只碗和昨晚那三只碗有了一样的分量——不是因为里面有什么,是因为外面缺什么。

埃尔斯伯格悖论 / 模糊厌恶

在不确定决策中,人偏好"已知概率的风险"胜过"未知概率的模糊"——即使两者的期望值相同,甚至模糊选项拥有更高的期望值。这个偏好无法用经典期望效用理论解释。
故事元素概念对应
左碗和中碗——三红三黑,概率已知已知风险(Risk)——概率分布确定
右碗——没人知道骰面的分布模糊性(Ambiguity)——概率分布未知
人们宁愿押左碗也不押右碗,虽然后者赔率更高模糊厌恶——偏好已知风险,即使其期望值更低
苏慕念的三碗实验:三颗相同的骰子,其中一碗贴上"未知"标签后无人问津埃尔斯伯格二瓮问题——标签本身改变偏好,实质与标签无关
押左碗输了坦然,押右碗输了难受模糊的成本——未知概率影响归因和情绪体验
店家说"它从不坏规矩"模糊选项客观上可能是公平的,但主观上仍被拒绝
纸片"比骰子更管用"模糊性本身具有独立的心理权重——不是风险的函数

Ellsberg, D. (1961) "Risk, Ambiguity, and the Savage Axioms." Quarterly Journal of Economics, 75(4), 643–669.——首次提出埃尔斯伯格悖论,以双瓮问题证明人在不确定下系统地偏离主观期望效用理论的预测方向。

Gilboa, I. & Schmeidler, D. (1989) "Maxmin expected utility with non-unique prior." Journal of Mathematical Economics, 18(2), 141–153.——为模糊厌恶提供公理化基础。

Klibanoff, P., Marinacci, M. & Mukerji, S. (2005) "A smooth model of decision making under ambiguity." Econometrica, 73(6), 1849–1892.——将模糊厌恶建模为"二阶概率的凹函数"。

#006 · 研究生 · 控制论/信号处理
陆长骅 老姜头 苏慕念

看不见的鹿

卡尔曼滤波 · Kalman Filter · 2026-06-10

这个故事里不会有任何学术术语。读到结尾之前,你不会知道它在讲什么。

陆长骅蹲在溪边的碎石滩上,看着地上那一滩已经半干的血。

箭头嵌在鹿的右后腿上方——不是致命伤。鹿蹬了几下,站起来,踉跄着钻进林子里了。那是半个时辰前的事。现在血迹已经淡到要看不出来了。

天色在暗。雾在森林的底部长起来,越来越浓。

他站起来,拇指搓了搓食指的侧面——这是他脑子转不过来的老毛病。老姜头靠在旁边的树干上,用指背轻轻碰了碰树皮上一道新鲜的刮擦痕迹——鹿蹭过的。然后他往另一个方向走了。

陆长骅没跟上去。他知道老姜头不会告诉他"该往哪走"。

···

鹿在山里留下了很多线索。

血迹。蹄印。被碰断的蕨草。泥地上的凹陷。陆长骅选了最简单的方法——跟痕迹走。他弯着腰,一步一步,每找到一个印记就往前挪一点。头五十步很顺利。

然后血迹断了——被一条浅溪截断了。溪水很浅,但正好能把所有的痕迹都冲干净。

他站在溪边看了看对面——一大片蕨草和青苔地。没有血迹,没有蹄印,连被踩断的草茎都找不到。他沿着溪往上游走了一百步——什么也没有。往下游走了两百步——什么也没有。

他蹲下来,掌心贴着地面。

——什么也没有。

老姜头已经过了溪,在对面一棵老松下面站着。他没看地面——他在看远处的山脊线。

第一种办法:死跟痕迹。

陆长骅决定相信痕迹。

血迹没了,就找蹄印。蹄印没了,就找踩断的草。草断了找不到,就看苔藓上的凹陷。他用这个办法,一步一步捱过了那片蕨草地——花了将近半个时辰,前进了不到一里。然后他听到了水声。

他又到了一条溪边。不是刚才那条——是另一条。他花了半个时辰,就在山沟里兜了一个大弧。

第二种办法:测地势。

痕迹会消失,地形不会。

陆长骅退到高处,把这片山势看了一遍。鹿受了伤,不会往开阔的地方走——会往低处、有水源、能隐蔽的方向。他判定鹿往东南走了——那边是河谷,两岸密林,有浅滩可以饮水。

他沿着这个方向大步前进。走了大约两里,真的看到了新鲜的蹄印——浅的,不深,不是奔跑而是蹒跚。方向:东南。

他又往前走了一里。蹄印彻底消失了——前面是一片开阔的石滩。鹿不会走石滩——它一定转向了。但是转向左边还是右边?左边是一条陡坡,受伤的鹿爬不上去。右边是一片密不透风的荆棘丛。

他选了右边。钻进荆棘丛,衣服被划了好几道口子,走了三百步——没有鹿的痕迹。他退出来。又花了半个时辰,在路口重新判断——还是不知道该往哪走。

第三种办法:交替。

走一段就停一下——先用痕迹确认大致位置,再用地形预测下一段的方向,交替执行。

陆长骅的新办法:每找到一条有效线索,就沿着这个方向追一段远的。追到线索中断,停下来,用一刻钟的时间判断大致走向。然后快速穿过这片区域,直到找到新的线索。

比前两次都快——不到一个时辰就穿过了那整片山沟。但他遇到了一个新问题:每次调整,不知道调多少。

有一次他预判鹿往西走了,发现实测指向东。他用力过猛地往回拉——结果错过了真正偏南的方向。有一次他预判对了大致方向,但觉得"不可能这么顺",反而停下来重新测——延误了时机。

不是跟不跟的问题。是跟了之后,该改多少?他的"调整量"全凭直觉。要么调得太多,要么太少。

···

天黑透了。林子里什么都看不见。

陆长骅停了下来。不是因为不想追了——是他发现自己不知道自己在哪,不知道鹿在哪,不知道自己现在该往哪走。三种办法他都试了,每一种单独用都不够。交替用,又不知道每次交替的时候该用多大力。

他坐在一棵倒下的树干上。雾已经很浓了,连三步外都看不清。林子里只有风声和他自己的呼吸声。

他把今天的每一步在脑子里过了一遍。每一条找到的线索,每一次做出的判断,每一次判断错误之后的懊悔,每一次用力过猛地往回拉——然后错过了真正的方向。

他闭上眼睛。

然后他听到了一个声音——不是风声,不是林子里野鸟的叫声。是一个很轻的声音,像是什么东西碰在石头上。

他睁开眼。

老姜头不知道什么时候已经在旁边坐下了。面前摆着两只野兔——已经剥好洗净,用树枝串着。火堆不知道什么时候已经生好了。老姜头像是什么都没发生一样,把兔子架上去翻烤。

陆长骅盯着那两只兔子,又看了看老姜头的鞋——没有新泥,衣角没有剐蹭。他开始怀疑老姜头根本没去追那只鹿——他用了不到一个时辰打了两只野兔,还生好了火。

"你那个交替走的法子方向是对的。步子大了。"老姜头翻了一下兔腿,油脂滴进火里,滋滋响。

"鹿跑的路不是直的。它有来有回,不是径直跑一个方向。你每次发现走偏了就整个扳回来——你扳太多了。鹿只偏了一点点,你整条路都换了——方向是对了,但你跟丢了它真正的位置。"

陆长骅没说话。他盯着火,忽然站起来走向空地——蹲下来,用手指在火光照到的地面上画了一条歪歪扭扭的线。

他走过的路线。

每一步都指向一个方向,然后修正,然后修正的修正。他看着那条曲曲折折的线——忽然意识到那不是追踪的问题,是"修正的量"的问题。他根本不知道应该把方向拧多少。

···

"你有没有注意到一件事?"一个声音从火光外面的雾里传进来。

苏慕念从雾里走出来。她的衣襟上沾着露水,手里拎着一盏纸灯。

"你每发现一次预判和实际不一样——你是怎么决定该改多少的?"

陆长骅蹲在地上,看着自己画的那条线。手指在沙面上停住了。

苏慕念把纸灯挂在树枝上,在火堆边坐下。她没看陆长骅——目光落在他面前那个沙地上的图上面。

"你的预判不是每次都一样不准。有时候你的预判很准——鹿走的路跟你猜的几乎一模一样。有时候你的预判差得远——鹿完全没按你想的走。但你每次的'修正量'——是一样的。不管准不准,你调整的力气都一样大。"

陆长骅的手指在沙地上一动不动。

"你预判准的时候,追得多紧?不准的时候,放得多松?"

他张了张嘴。没有答案。

因为他从来没有分过这两笔账。他的注意力全花在"预判和实测哪个对"上了——没有一次想过"这两个各自准到什么程度"。

他把那根树枝拿起来,又在沙地上画了两条线。

一条是预判的线——平直的,指向东南。一条是实测的线——弯弯曲曲,时隐时现。

两条线之间的空隙,就是每次的偏差。

苏慕念低头看了看那两条线,然后伸出手——用一根小树枝,在那两条线之间画了一根新的线。不是中间值。不是平分。是偏向实测多一点还是少一点——取决于当天那个时刻,预判有多准、实测有多稳。

"你下次再追的时候,"她站起来,拍了拍裙子上的灰,"先问自己一句——你现在这两笔账,各自有多靠谱。搞清楚了再动。"

···

陆长骅没有立刻明白这句话的全部意思。

但他记住了那个画面——他画的两条线,和苏慕念加在中间的那条线。不是他自己画的那种简单的折线——是他没有见过的。

他坐在火堆边想了很久。火快灭了。老姜头已经把一只兔子吃完了。

"你追的那头鹿,三更天的时候跑到西边的泉水边了。"老姜头把兔子骨头丢进火里。"你没追丢——你一直跟在它后面。你的方向从来没大错——但你的步子,不是大半寸就是小半寸。你哪次调对了,什么时候调对了,你自己都不知道。"

他站起来,走向林子里。走了几步,回头说了一句——

"你看着这个。"

他蹲下来,用手在地上画了一条线——一条几乎是直的线,只有极微小的起伏。然后他在旁边画了陆长骅那条歪歪扭扭的线。同样的起点,同样的终点。

"你走的和鹿走的一样的路。你只是每次都动多了。"

陆长骅看着那两条线看了很久。

不是选预判还是选实测。是两个都要——但两个的分量不一样。

当你不知道自己预判有多准的时候,你不知道该给实测多少权重。当你不知道实测有多稳的时候,你不知道该把预判放掉多少。

问题不是"哪边对了"。问题是你从没问过自己:我现在这个预判,我有多相信它?

你相信它的程度——决定了你应该让它占多大分量。

他不知道那个词——卡尔曼滤波、状态估计、增益系数。但他知道了这个道理。

他抬起头。雾已经开始散了。

天亮之前,他还能找到那只鹿。

卡尔曼滤波 Kalman Filter

一种最优状态估计算法:当无法直接观测系统真实状态时,通过交替执行"预测"(基于系统模型)和"修正"(基于含噪声的实测)两个步骤来逼近真实值。修正量的大小由预测和实测的相对不确定性决定——预测越不可靠,越依赖实测;实测越嘈杂,越信赖预测。这个比例就是卡尔曼增益(Kalman Gain)。
故事元素概念对应
陆长骅跟踪受伤的鹿,但鹿的位置永远无法直接确定状态估计——真实状态不可直接观测
根据鹿的习性、地势判断鹿往哪走预测步(Predict)——基于系统模型的先验估计
跟踪血迹、蹄印、碰断的草茎等痕迹测量步(Measure)——含噪声的观测值
"预判和实测之间的偏差"残差/创新(Residual)——实测与预测之差
陆长骅每次"调多了"或"调少了"卡尔曼增益——确定预测和实测的权重分配
苏慕念问"你这两笔账各自有多靠谱"不确定性量化——预测协方差和测量噪声协方差
老姜头的线几乎是直的——极小修正最优增益——当预测不确定性低时,小幅修正即可
陆长骅的路线歪歪扭扭次优增益——增益不匹配导致的振荡和延迟
"不是选哪边——是两个都要,分量不一样"卡尔曼滤波核心——贝叶斯融合预测和实测
"你每次的修正量都是一样的"固定增益 vs 自适应增益——固定值无法应对噪声变化

Kalman, R. E. (1960) "A new approach to linear filtering and prediction problems." Journal of Basic Engineering, 82(1), 35–45.——首次提出卡尔曼滤波,用状态空间法处理离散数据的线性滤波问题。注:这篇论文被引超过10万次。

Kalman, R. E. & Bucy, R. S. (1961) "New results in linear filtering and prediction theory." Journal of Basic Engineering, 83(1), 95–108.——将卡尔曼滤波扩展到连续时间系统。

Welch, G. & Bishop, G. (1995) "An introduction to the Kalman filter." University of North Carolina at Chapel Hill, Department of Computer Science, Technical Report 95-041.——最广泛使用的入门教程,非数学专业的系统学习入口。

"信多少,看的是你有多不肯定。"
#007 · 研究生 · 社会神经科学/进化心理学
苏慕念 江不周 陆长骅

记不下了

邓巴数 · Dunbar's Number · 2026-06-10

这个故事里不会有任何学术术语。读到结尾之前,你不会知道它在讲什么。

这个故事里不会有任何学术术语。读到结尾之前,你不会知道它在讲什么。

···

苏慕念是在白驼镇最大的账房里发现那个问题的。

那时候她正帮商队的老掌柜整理名册——厚厚一沓,牛皮纸封面已经磨得发亮。她翻开第一页,从头到尾看过一遍,合上,然后问了一句让整个账房安静下来的话:

"掌柜的,这上面的人——您能叫出名字的,大概有多少?"

老掌柜正在打算盘,手没停:"三百一十二号人,都是我的。每张脸都认得。"

"那您叫一个来看看。"

老掌柜放下算盘,接过名册——打开——看了很久。第一页他认识七八个。第二页认识五六个。翻到第五页,他沉默了。整本名册,他能准确地把名字和人对上的——不到四分之一。

苏慕念没有说话。她的手指在袖口里画了一个圈。

江不周靠在门框上,挑起眉毛:"所以呢?管三百号人记不住名字不是很正常?"

"正常。"苏慕念说。"但我想知道为什么是四分之一。"

···

她花了三天时间,从名册的第一页到最后一页,一个一个问。

不是问"这人是谁"——是问"你跟他上次说话是什么时候"、"你知道他家里几口人吗"、"你遇到难处会不会第一个想到他"。

老掌柜被问得莫名其妙,但还是一一回答了。

苏慕念把答案写在另一张纸上,画了几道线。她发现了一件事:老掌柜的回答里,有一个很清楚的分界。

前面大约四五十个人,他能说出每个人的家庭情况、脾气性格、谁跟谁合不来。再往后六七十个人,他知道他们什么活干得好、有没有惹过麻烦,但说不上他们家里的事。再往后——从第一百五十人左右开始,他对每个人的印象就只有一句话:"哦,那个谁,挺好的。"

不是不熟。是后面的两百个人,他统共就记得这么多。

**第一种办法:多见面。**

苏慕念建议掌柜的轮换——每天见不同的人。

第一周,掌柜的见了五十个平时不怎么见的人。每天花一个时辰单独聊。确实有效——到了第七天,他能叫出其中二十多个人的名字,还知道其中两三个人家里添了丁。

然后第二周来了。他继续见了另外五十个人——然后发现第一周见过的那二十多个,又有十来个记不起来了。"我总不能每天跟三百个人都聊一遍吧?"老掌柜说。

不是不想——是做不到了。时间不够。精力不够。一天就算见二十个人,把三百一十二号人轮一遍也要半个月。半个月之后,最早见过的那批,又开始模糊了。

**第二种办法:建册子。**

"记不住就看册子。"江不周说。

掌柜的每人建了一个档——名字、籍贯、擅长的活、加入的年份。厚厚一本,放在账房的桌上,谁来都可以翻。

一个月后,账房多了几项东西:一本考勤簿、一本奖惩录、一本工钱账。名册本身算是齐全了,每一页都填得满满的。

但问题跟着来了:名册越厚,掌柜的反倒越不翻它了。他每次要查一个人的时候,翻三页就放弃——在后厨喊一嗓子"那个谁!过来一下!"比翻册子快。

名册没有缩小人与人之间的距离。它只是让"记不住"这件事变得没那么尴尬。

**第三种办法:分小队。**

陆长骅是在苏慕念最想不通的时候来的。他刚好押了一趟货路过白驼镇,进门就看见苏慕念面前铺了一桌子的纸——人名、箭头、圈圈。

"这是干什么?"他搓了搓食指侧面。

苏慕念把她的困惑说了一遍:"三百个人,怎么才能让掌柜的都记住?"

陆长骅听完,把身上背的弓取下来放在桌上。"你在猎场待过吗?"

"没有。"

"打猎的时候,一个人最多管五个人。超过五个,顾不过来——有人后面掉队了都不一定知道。"

"可商队不是打猎。"

"商队也确实不是打猎。"陆长骅说。"但我说这个,是因为——"

"——因为人的眼睛就两只,耳朵就一对。"苏慕念接上了。

"对。你不可能同时看着三百个人。但你可以让一个人看着十个人,然后这个人的上面再放一个人……"

"就像——"

"就像百户制。"陆长骅说。"十个兵一个什长,十个什长一个百户,十个百户一个千户。千户不认兵,他只认那十个百户。"

苏慕念沉默了。她看着桌上那堆纸,没有点头——但她的手指在桌沿画了一圈,一圈,又一圈。

···

她去找了老掌柜。

"您一个人的确记不住三百个人。但如果有十个人,每个人都替您记住三十个——"

"那就都能记住?"老掌柜接过她的话。

"对。但您不是让他们"替您记"——您是让自己"只记十个人"。然后让这十个人各记三十个。多出来的那一层,就是您的脑子没办法同时装下的数量。"

她停了一下。

"问题不是您记性差。问题是——有一道线,脑子自己画在那里的。不超过那道线,关系是真关系。超过了,就变成一个个名字。"

"那这道线在哪?"

"一百五左右。"苏慕念说。"不对——不是一百五。是您单独管理、不用中间人的时候,撑死了一百出头。超过这个数,你就需要帮手了。"

"需要帮手"她用了这四个字,没有说"你的脑子容量不够"。老掌柜点了点头,没有多问。

但他第二天就找了四个档头来,把三百一十二号人划成了五块。每个档头管自己那块——掌柜只管五个档头。

半个月后,账房的纠纷少了。不是因为制度好了——是因为每一个档头,真的能记住自己那六十多号人的名字、脾气和难处。掌柜记不住的事,档头记得住。

···

那天晚上,苏慕念坐在账房门口,面前一碗茶,手里那张已经被揉得皱巴巴的名册静置在桌上。

陆长骅坐过来,往她碗里看了一眼——还没喝。

"你想通了?"

"我只是在想,"苏慕念说,"那个数字。人能记得住的名字,是有上限的。不是记性的事——是脑子就那么大。它给你划了一道线。"

她顿了顿。

"线以内的是'我认识的人'。线以外的,是'我知道的人'。掌柜的硬要记住所有人——他不是做不到,是他做到之后,那些"认识"跟"知道"之间的差别,没了。"

陆长骅没答话。他伸手把那本名册拿起来,翻了翻——三百一十二个名字,密密麻麻。

"你知道我是怎么看这本册子的吗?"

苏慕念看他。

"我觉得它很厉害。"陆长骅说。"不是因为写了三百一十二个名字——是因为它能看出你在哪道线里。"

---

邓巴数 Dunbar's Number

**邓巴数(Dunbar's Number)**

人脑新皮层容量限制了能够维持稳定社会关系的数量——人类的上限约150人。在此之内,关系靠直接互动维持(记忆面孔、名字、性格、亲属关系);在此之上,关系必须靠制度、语言、仪式、层级结构来间接维系。150不是"你认识多少人"——是"你能维持多少段可互惠的真实关系"。

---
故事元素概念对应
------------------
老掌柜有三百一十二号人,能叫出名字的不超过四分之一邓巴数的经验表现——150是"有意义的社交关系"上限
苏慕念问"你跟他上次说话是什么时候"——前面50人知道家里的事,中间60-70人知道干什么活,再往后只剩一句话邓巴层级结构:5(亲密)/15(好友)/50(朋友)/150(有意义)/500(认识)/1500(面熟)
"每天见不同的人"方案——见了后面的,忘了前面的社会时间预算约束——维持关系的精力有限
"建册子"方案——册子越厚,越没人翻制度化不改变认知容量——记录可检索,但无法替代关系本身
陆长骅说百户制——什长管十个兵,百户管十个什长,千户只管十个百户分层管理是突破邓巴数的进化策略——通过层级超越150上限
"需要帮手"——五个档头各管六十多人信息传递、社会学习、语言——取代一对一互动的机制
苏慕念说"不是一百五——是你单独管理的时候,撑死了一百出头"邓巴数不是一个精确值而是量级——实际因个体、文化略有浮动,但不会超过一个数量级
"线以内是'我认识的人',线以外是'我知道的人'"邓巴的核心:150以内是关系(relationship),150以上是分类(category)

**Dunbar, R. I. M. (1992)** "Neocortex size as a constraint on group size in primates." *Journal of Human Evolution*, 22(6), 469–493. ——首次基于38个灵长类属发现新皮层比率与平均群体大小的对数线性关系,并预测人类自然群体上限约为148。

**Dunbar, R. I. M. (1993)** "Coevolution of neocortical size, group size and language in humans." *Behavioral and Brain Sciences*, 16(4), 681–694. ——将语言定位为"社交梳理的替代机制"——语言使人类在不增加梳理时间的前提下维持大群体。

**Hill, R. A. & Dunbar, R. I. M. (2003)** "Social network size in humans." *Human Nature*, 14(1), 53–72. ——通过圣诞卡发送统计实证检验邓巴数,发现主动发送对象数量的上限约150。

---

已完成 7 / 60 篇 · #007 今日新撰

#001守夜人的眼睛 · 信号检测论 · 陆长骅+老姜头 · 2026-06-07
#002不后悔的买卖 · 最优停止理论 · 苏慕念+江不周 · 2026-06-07
#003偏差-方差权衡 · 陆长骅 · 2026-06-07 (Marvis版,摘要已收录)
#004到头了 · 鞅收敛定理 · 陆长骅+老姜头+许燃 · 2026-06-08
#005三碗骰子 · 埃尔斯伯格悖论/模糊厌恶 · 陆长骅+苏慕念+江不周 · 2026-06-09
#006看不见的鹿 · 卡尔曼滤波 · 陆长骅+老姜头+苏慕念 · 2026-06-10
#007记不下了 · 邓巴数 · 苏慕念+江不周+陆长骅 · 2026-06-10 (本篇)