#001 · 研究生 · 决策理论/心理物理学
沈渡 老姜头

守夜人的眼睛

信号检测论 · Signal Detection Theory · 2026-06-07

这个故事里不会有任何学术术语。读到结尾之前,你不会知道它在讲什么。

沈渡是在七月的第三个夜里感觉到不对的。

塞外的风裹着沙,打在城楼的砖墙上,发出细密的声响。他裹紧羊皮袄往东段走,满月把戈壁照成一片惨白。他搓了搓食指侧面——这是他脑子转不过来的老毛病。

"有什么情况?"

小个子哨兵没回头:"三更前后,东北方向,两次一闪一闪的。像火又不太像。"

旁边老姜头靠着墙垛,烟杆叼在嘴里,烟锅早灭了。

沈渡看了看东北——什么也没有。

但他心里不踏实。这三个月来,小个子报了太多,老姜头报得太少。两个人守同一面城墙看同一片夜空,报上来的东西南辕北辙。

···

上个月的记录他翻了不下十遍。小个子报了十二次"可疑火光"——十一次假的,一次真的。老姜头呢,一次没报。可粮草官偏就被劫了——城外二十里的补给的队伍,青天白日让人端了。

把总拍着桌子:"你的人有问题。虚报太多浪费兵力,形同虚设。调一调。"沈渡调了。先找小个子:"盯久一点再说。"头几天报得确实少了——但沈渡觉得他反应慢了,以前火一闪就绷紧,现在先犹豫。又找老姜头:"多留个心眼。"老姜头报了几次——沈渡亲自去看过,屁也没有。最后把两人防区对调——第一晚,小个子在对面报两次假的。老姜头在西边一夜无话。

问题不跟位置走。问题跟人走。

···

沈渡在城墙上来回踱。戈壁滩上一丛骆驼刺在风里摇,影子像一个人蹲着。他盯着看了很久——就是丛骆驼刺。但他真切地感到自己正在做决定:决定这丛刺"不值得报告"。这个判断来自他当兵五年的经验。可自己刚到镇北台那会儿呢?会不会也为这样一丛刺紧张过?

会的。后来慢慢不紧张了。那小个子是不是正处在"什么都紧张"的阶段?老姜头处在"什么都不紧张"?但老姜头不一定对。小个子不一定错。

···

三天后来了个退役的百户长——魏爷,年轻时在辽东守了三十年墩台。沈渡端了碗热酒过去聊起人手的事。

魏爷抿了一口酒:"你那个报得多的,报的有没有真货?"

"十一次假的,一次真的。那一次不是真货粮仓就没了。"

"你那个报得少的,他刚来的时候也不报?"

沈渡愣了一下。老姜头说他十六岁在大同就开始当差了,从来就没什么好报的。

魏爷站起来走到窗边,指着城外:"那个影子,石头还是人?"

"石头。用了三息确定。"

"你那个小个子呢?"

"他一息就决定了——是人。然后半炷香后发现是石头。"

"老姜头?"

"他看了一眼,不需要决定。根本不值得看。"

"他们看到了三样不同的东西?"

"不。看到的东西是一样的。"

"那结论为什么不一样?"

沈渡张了张嘴,说不上来。

"因为每个人需要一定程度的'确定'才愿意说'有',"魏爷说。"你用了三息,小个子一息,老姜头不需要——你们心里的那条线画在不同的位置。"

魏爷从怀里摸出一张泛黄的纸,上面画着两条曲线,一部分叠在一起。"辽东一个识旗的老兵画的。他说风声和敌音不一样——但有时候风声听起来像敌音。左边是风声,右边是真的敌音。有一部分,你分不出来。

"你要在某个地方画一条线。画太左,你虚报多。画太右,你漏报多。你无法消除虚报和漏报——你只能选择在哪里平衡。"

这就是 信号检测论(Signal Detection Theory)。任何一个"是/否"判断里,藏着两个独立的东西——你的分辨力和你愿意冒多大风险才说"是"。

···

天快亮的时候老姜头端了两碗热茶来。

"我十六岁在大同,头一年报了二十七次疑火。没一次真的。"他喝了一口茶。"后来就不报了。"

沈渡忽然懂了。问题不是老姜头"标准太严",是他把标准调得太严了——严到他自己都不知道已经调过了头。小个子是把标准调得太松。但没有谁能说哪个是对的。

这世上没有一条完美的线。只有你在哪里画下它,和你是否知道它在那里。

信号检测论 Signal Detection Theory

任何"有/无"判断都可分解为两个独立指标——分辨力(d')和判断标准(c)。改变判断标准同时影响命中率和虚报率,两者无法独立优化。
Tanner & Swets (1954) "A decision-making theory of visual detection." Psychological Review, 61(6), 401–409.

Swets (1988) "Measuring the accuracy of diagnostic systems." Science, 240(4857), 1285–1293.
#002 · 研究生 · 决策理论/最优化
苏念 江不周

不后悔的买卖

最优停止理论 · Optimal Stopping Theory · 2026-06-07

这个故事里不会有任何学术术语。读到结尾之前,你不会知道它在讲什么。

苏念在第三个摊子前站了很久。

这是镇上一月一次的集,卖山货的摊子一共七家。她要买一对品相好的鹿茸——沈渡摔伤了腿,老姜头说鹿茸泡酒管用,赶不上这趟就得等一个月。

第一家,鹿茸片薄但发白。她没说话,站起来走了。第二家,成色好一些,但左边那支根部的切面有裂。她又走了。第三家——鹿茸形正、色润、切片厚薄均匀。摊主是个四十来岁的老猎户。苏念在光下照了照切面。很好。比前两家都好。

但她没有掏钱。

···

"还不买?"江不周不知道什么时候站到了她身后,嘴角带着那副"你这不对吧"的弧度。

"再看看。"苏念说。

"你已经看三家了。这家最好。"

"后面还有四家。"

"万一后面不如这家呢?你回头,人家已经收摊了。"老猎户确实已经在收拾东西了。

"再看看。"苏念说。

···

第四家,形好但偏小——她没拿起来就走过去了。第五家,没有鹿茸。第六家,切面颜色均匀得过分离谱——染过的。第七家在最边缘,鹿茸只有一对,形不正,右支弯曲,纹理有点乱。

往回走经过第三家——老猎户已经走了。地上空了。

江不周没说话。苏念站在空摊前。"……早了。第三家就是最好的。我知道。"

"那你当时为什么不买?"

苏念没有回答。手指在袖口里画了一个圈。她自己也不知道。

···

往回走的路上,江不周终于忍不住了:"你第三家就看上了,后面看了四家——没有一家比那家好。你明明知道它是!"

"万一呢?"

"万一什么?万一有更好的?结果呢?"

苏念站住了。她站在那里,站在集市末尾的土路上——如果第三家确实是今天最好的,她需要看到第几家才能确定这一点?答案是:全部。只有看到全部七家,她才能确定第三家是最优的。可到那时候,第三家已经不在了。

···

晚上她坐在茶馆里,面前一碗茶凉透了也没喝。沈渡拄着树枝拐进来,看见脸色就知道没买到。她把今天的事说了一遍。"不周说我不做决定是不敢——但他只说对了一半。我不怕做决定。我是怕信息不够。没有看完怎么能确定是最好的?"

沈渡搓了搓食指侧面:"那得看多好才算好。如果不是最好的一个,而是足够好——你还需要看完所有吗?"

···

第二天一早,苏念去找了江不周。"昨天你说我的问题是不敢做决定。不全对。我的问题是我要看到全部才能决定。但全部看不到。我追求的不是足够好,是绝对最好。如果你追求绝对最好——你一辈子都在等。"

那不是直觉能回答的问题。但它有一个数学答案——最优停止理论(Optimal Stopping Theory),其最著名的形态是秘书问题(Secretary Problem)

当你必须在不知未来选项的情况下依次做选择,最优策略是:拒绝前 N/e 个候选(约37%),然后选第一个比之前所有都好的。这不是经验法则——它有严格的数学证明。无论你面对7家摊子还是1万家摊子,37%的门槛不变。前37%用来看清"好的标准是什么",之后第一个超过这个标准的就停。

苏念听完没有点头。她沉默了很久,手指在膝盖上画了三圈——然后说了一句不是总结的话:"所以问题不是我需要看完全部——是我没给自己设一个停止规则。"

最优停止理论 Optimal Stopping Theory

在不知未来选项的情况下,最优策略是拒绝前37%的候选用于校准标准,然后选择第一个超过该标准的选择——此策略选中全局最优的概率始终保持约37%。
Gilbert & Mosteller (1966) "Recognizing the maximum of a sequence." Journal of the American Statistical Association, 61, 35–73.

Ferguson (1989) "Who solved the secretary problem?" Statistical Science, 4(3), 282–289.
#003 · 研究生 · 统计学习理论
沈渡

偏差-方差权衡

Bias-Variance Tradeoff · 2026-06-07(Marvis版本)
#003 偏差-方差权衡 由Marvis版本生成,full content暂未同步至当前artifact。概念核心:

任何模型的预测误差可分解为三部分——偏差(bias)、方差(variance)和不可约噪声。偏差是你假设错了形状,方差是你对数据太敏感。两者此消彼长:你越想把曲线拟合得跟数据点严丝合缝(降偏差),你的模型就越容易因为换了几个数据就大翻盘(升方差)。

故事背景:沈渡学射箭,发现瞄得越准、动作越精细,反而越容易因为一阵风就脱靶——太精准的模型反而脆弱。

偏差-方差权衡 Bias-Variance Tradeoff

预测误差 = 偏差² + 方差 + 噪声。模型越复杂,偏差越低但方差越高;模型越简单,偏差越高但方差越低。最优模型在两者之间平衡,而非追求任何一端的极致。
Geman, Bienenstock & Doursat (1992) "Neural networks and the bias/variance dilemma." Neural Computation, 4(1), 1–58.——首次系统阐述偏差-方差分解及其在神经网络中的核心意义。
#004 · 研究生 · 概率论/随机过程
沈渡 老姜头 许燃

到头了

鞅收敛定理 · Martingale Convergence Theorem · 2026-06-08

这个故事里不会有任何学术术语。读到结尾之前,你不会知道它在讲什么。

沈渡站在自己做的箭垛子前面,看了很久。

两百多支箭插在草靶上,箭尾的羽色从浅到深——每一批换一种颜色。最浅的那批歪得像喝醉了酒,越往后越正。但最新那批和最前面那批之间,差得越来越小了。最新一批的箭杆挺直、箭羽齐整、箭簇打磨得锃亮——射出去,还是偏那么一寸。不多不少,正好一寸。

他搓了搓食指侧面。

老姜头从后院走进来,指背轻轻碰了一下箭杆,什么也没说。

···

沈渡的目标是做出一支完全不偏的箭。

这句话他说了四个月。头一个月他连箭都做不直——桦木杆削出来粗细不匀,射出去自己能飞偏三尺。第二个月能做了,但箭羽绑不稳。第三个月箭杆直了,箭羽稳了,箭簇也磨得对称了——但射出去,那尾羽还是抖。

他试了所有能想到的办法。

第一种办法:从源头改材料。

他把箭杆从桦木换成柘木——柘木硬,密度均匀,比桦木贵了三倍。头一批柘木箭出来,他搭弓射了一箭。箭带着风声出去,扎进草靶——偏了半寸。

半寸。

比桦木好了不只是一点半点。他高兴了三天。然后做了第二批柘木箭,跟第一批比——偏了差不多也是半寸。他又做了第三批——还是半寸。材料换了,天花板也换了,但天花板还是在。

第二种办法:精调搭配。

他开始记参数。每支箭的羽毛偏转角、箭簇重量、箭杆的弯曲度、绑羽的线距。他做了十四组组合,每组射五支,量偏差距离记在本子上。十四组数据摊了一桌子,墨迹密密麻麻。

最好那组和最差那组差了一截——但最好那组跟柘木批次平均比,几乎一样。他对着那堆数据,一支一支翻过来翻过去地看。不管怎么调参数,都到不了那个"完全不偏"的坎。参数组合变了,结果在那条线附近浮动——上不去,也下不来。

第三种办法:请教老手。

隔壁镇有个姓陈的猎户,听说射箭是一把好手。沈渡拎了一壶酒过去,想看看人家怎么做箭。陈猎户也不藏私——拿出来给他看。材料就是普通的柘木,工序跟他差不多,做得还比他慢。沈渡要买一支回去拆——猎户说不卖,自己做的自己用。

沈渡回来的时候手里捏着那支箭,是他在猎户院里射过的。翻来覆去地看——跟自己的箭比外表,没有能看出来的差别。但射出去就是比他稳。

他把那支箭和自己的最新一批并排插在靶子上。左边的陈猎户箭,右边他最好的箭。靶心是同一个位置,偏的方向不一样,偏的距离——差不多。

他盯着看了很久。不是人家的箭更好。是他的箭也没差到哪里去。问题是"差不多"不是他的目标。

···

许燃路过箭铺的时候,沈渡正坐在门口的石头上,面前摆了三堆箭。

"你这是在干什么?"许燃话没说完已经蹲下来了。

"做箭。"

"做这么多?"她随手抄起一支浅羽的旧箭,搭弓射了一箭。箭飞出去,尾羽晃了两晃,偏了大约两寸。又拿起一支深羽的新箭——偏了大约一寸。

"这不进步了吗?"

"进步太慢了。"

"那你想要多快?"

沈渡说不上来。许燃看了他一眼,撸起袖子:"我也试试。"她没用两个时辰,按自己的理解做了十支箭——用的就是沈渡剩下的柘木,一样的工序,连工具都一样。射出去——跟沈渡最新的那批几乎一样。

沈渡把许燃的箭和自己最新那批并排插在靶子上。十支对十支。从靶心看,像是同一批——偏差都在一寸上下。没有人能分出哪十支是谁做的。

老姜头走过来,指背轻触了许燃那支箭的箭头,摸了一下又放下。

"你这一批,和上一批,和上上一批——中间差了多少?"老姜头问。

···

沈渡把三个批次的箭在石台上排开。桦木偏两寸。柘木第一批偏快一寸——从两寸到一寸,进步了一寸。柘木第二批偏大半寸——从一寸到大半寸,进步了不到三分之一寸。柘木精调那批偏半寸多——从大半寸到半寸多,进步了薄薄一层。

不是每次进步都一样大。是每次的进步本身就比上一次小。

"你注意到没有,"老姜头蹲下来,从地上捡起一支桦木旧箭,"你第一次换材料,进步了一寸。第二次精调,进步了三分之一寸。第三次……你自己都测不出来了吧。"

许燃在旁边吹了声口哨。

沈渡没有说话。他盯着石台上那三排箭——偏差在缩窄,但缩窄的速度本身在变慢。第一次的进步是第二次的三倍,第二次的进步是第三次的五倍。

他站起来,拿了一支最新批次的箭,搭弓——拉到满,盯着七十步外的草靶,慢慢地,慢慢地放开了弦。

箭飞出去。偏了。还是那个差不多的位置。

···

他坐在石台上,一直坐到太阳落山。许燃走了,老姜头也走了。院子里只剩他一个人和两百多支箭。

他在心里把所有尝试过的方法过了一遍——每一批的偏差数字在脑子里排成一条线,越来越密地聚在同一个区间里。不是"还能更准",是"在这个方法的框架下,这就是你能到的最好的了"。你再怎么调,参数再怎么换,它都不会再往前走了。

因为他每次调的依据都是上一批的结果——看上一批偏多少,然后往反方向调一点。这是最合理的做法,也是最自然的做法。但这个做法本身有一个隐含的前提:每一个微调都会带来等量的改善。

可现实不是这样的。改善本身在衰减。

他忽然想到了一个词。不是在书上看过的,是他自己在脑子里冒出来的——到头的尽头。每一次调整的依据都是上一次的结果,而上一次的结果已经无限接近那个"你在这个工具、这个材料、这个方法下能到的极限"了。后面每一次改进的幅度,都只取决于"你离极限还有多远"——而那个距离,每次都在减半。

他做不出完全不偏的箭。不是他不够努力。是这件事——在这个做法下——根本到不了。

···

老姜头从后院走出来,手里拿着一根不太像箭的东西——一根被河水冲得光溜溜的柳条,随手削了削尖头,尾部绑了三根野鸡毛。没有打磨过的箭簇,没有量过角度的箭羽,没有称过重量的箭杆。老姜头搭弓,拉满——放。

柳条穿过七十步外的草靶,钉在木桩上,尾羽在微风里轻轻颤了一下——不动了。

沈渡站起来走过去。那支柳条钉在木桩里,入木三分。他试着拔了拔,钉得很深。

"你没做它。"

"嗯。"

"你只是捡了它?"

"因为它是箭。"老姜头说。"不是'做出来的箭'。是'本来就是的箭'。"

沈渡站在那支柳条面前,站了很久。

他忽然懂了。他不是输在"做得不够多"——他是输在不知道"什么时候该停"。每一次微调都在缩小差距,但每一次缩小的幅度本身就在告诉他一件事:这条路正在走完。真正的选择不是继续调下去——是承认这个极限,然后问自己一句:你要不要换一条路?

灯火亮了。他把石台上三个批次的箭收进箭筒,那支柳条还钉在木桩上。

他没拔它。留着。

鞅收敛定理 Martingale Convergence Theorem

若一个鞅的期望绝对值有界,则该鞅几乎必然收敛于一个极限。通俗地说:当你的每一步调整只依赖上一步的结果、且调整幅度本身在持续缩小,你的最终位置必然收敛到某个天花板——不再取决于你有多努力,只取决于你出发时选的那条路本身的上限。
故事元素概念对应
沈渡的箭偏了一寸,怎么调都到不了"完全不偏"收敛极限——路径决定了你能到的最远位置
桦木→柘木:进步一大截;精调:进步一小截;继续调:几乎不可测量期望增量递减——每步改进幅度本身在衰减
每次调校基于上一批的结果鞅的马尔可夫性(下一步只依赖当前状态)
偏差缩窄速度在放缓收敛速度——且随着接近极限而趋于零
老姜头的柳条箭——换了路径跳出鞅结构——重新定义过程本身
"到头的尽头"——沈渡自己的感悟鞅收敛的含义:路径收敛是结构性的,不是人力可违
"我不是输在做得不够多——是输在不知道什么时候该停。"
Doob, J. L. (1949) "Application of the theory of martingales." Le Calcul des Probabilités et ses Applications, Colloques Internationaux du CNRS, 13, 23–27.——鞅收敛定理的首次完整表述。

Doob, J. L. (1953) Stochastic Processes. Wiley, Chapter 7.——奠定了鞅论的教科书,Doob下鞅收敛定理的经典推导。

Williams, D. (1991) Probability with Martingales. Cambridge University Press.——最易读的鞅论入门,适合非数学背景理解精华。

已完成 3 / 60 篇 · #004 今日新撰

#001守夜人的眼睛 · 信号检测论 · 沈渡+老姜头 · 2026-06-07
#002不后悔的买卖 · 最优停止理论 · 苏念+江不周 · 2026-06-07
#003偏差-方差权衡 · 沈渡 · 2026-06-07 (Marvis版,摘要已收录)
#004到头了 · 鞅收敛定理 · 沈渡+老姜头+许燃 · 2026-06-08 (本篇)