关于数据-信息

最近在思考一个问题,互联网时代下,数据,信息,唾手可得,而AI时代更让信息可以完全无成本的被生产。那么,什么是重要的?什么是不重要的?什么是高质量的?应该追求什么样的信息和数据? 似乎有几种答案: 1、模仿:选择一些人,无论是成功人士,还是有非凡见识的人。总有一些人是值得学习的。去寻找他们的言论,他们的推荐,他们的信息,他们的认知。在此基础上,提取元信息,那些本质的,第一性的。但是这也带来了问题。偏见,误差,往往别人说的话,别人写的文章是被润色的,并不是他心里猛然迸发的东西。然,真正决定一个人高度的,往往是他无法言说、猛然迸发的"直觉"”应该是这样“”潜意识“。语言是降维的,通过阅读文字去模仿他们的“命运”时,我们往往只学到了皮毛,却错失了他们决策背后那个庞大而沉默的潜意识,认知越深,知识量越大,哪些潜意识越容易被掩盖。会越来越认为,我已经掌握了潜意识,我的表达就是我,而潜意识不是。就此忽略了可能最重要的东西。 2、广泛:尽可能多的了解,尽可能多的学习,我也是这么做的,但是发现,学不完,不可能学的完,庄子云:“以有涯随无涯,殆已。在无限的信息面前,贪就是穷。世俗的东西已经让自己精力有限,那只有寻找感兴趣的东西。 3、时间:经过实践检验的东西,才是真的,能留下的都是精华。一本书存活了50年还在被读,大概率比上周出的畅销书更值得读。也就是林迪效应——存活时间就代表质量。但是一直读资治通鉴,孔孟老庄,恐怕会错过新的研究,新的范式。再者说,三字经等等旧内容存活真的是因为质量?还是因为统治阶级的需要?厚古薄今与厚今薄古,都是偏见。 4、信息节食、断食、禁食:这个点其实是某种解决策略,主要是消化已经有的东西,深入思考。本质是暂时停止输入,自我清理已经接收到的信息。就像电脑运行太多程序会卡顿,关掉一些就能恢复流畅。如同马伯庸最近提出的记录法:“只记录事实,不记录观点。” ,我似乎老是被辩论思维影响,希望找到多方视角,希望在任何一种视角下找到正反两面。在两面的碰撞中寻求交融和统一,但需要思考的是:有没有在观点的碰撞中丢掉了事实本身? 反思:信息就如同鸦片,我们停不下来,我们被淹没,时间过去,留下了什么?似乎什么都没留下。 回望过去几年的互联网记忆: 别迷恋哥哥只是个传说 先定个小目标。挣他一个亿 且行且珍惜 汪峰离婚了!汪峰又结婚了! 挖掘机技术哪家强 no zuo no die 听懂掌声 …… 反而,我有点过想不起,这两年有什么新的网络热词,热梗,似乎也就是前段时间的斩杀线比较有点印象。什么都不记得。 这些曾经繁花似锦、烈火烹油的热梗,如今留下了什么?除了一地鸡毛,我想不起任何对生命有滋养的东西。即使是前段时间有些印象的“斩杀线”一词,恐怕也会在半年后被大众遗忘,而后惊呼,他们曾经居然那么火。 孔子曰:群居终日好行小慧难矣哉!如果把所有的精力都从自我的内心成长转移到外界的琐碎,难以哉! 今天,展开一本厚厚的书,确实读不下去,为什么?因为这是需要集中精力的,是需要定力的,是需要动脑子的,是需要反人性的定力的,是反脆弱的修行。而抖音/B站是脆弱的,没有心流,只有舒适圈。 突然回想,没想到这样的信息,是我在十年前就听到的。当时高中的我没听懂,甚至大学的时候也没听懂,当我猛然思考到这个话题的时候,没想到,和它相遇了。 这是熊浩在2016年的演讲,为时代发声,今天听来,依旧是振聋发聩。为时代发声音 慕然回首,那人却在灯火阑珊处! 本文为此项目源头: 元认知-元信息 。yy兄开源项目[cabinet](DayDreammy/cabinet: Cabinet: a quote-centric, transparent long-context research MVP.)也给了很多启发

January 19, 2026

2025记录

跨年的时候发了朋友圈。 以往都要写很多文字。今年写的是最少的。反而2025的经历是最丰富的。做了蛮多事情,反而越不想在朋友圈表达。 反而每个字都字斟句酌,一句话里边有好几个想表达的意思。能一句话说清楚的事情,为什么要让人猜呢?不知道。可能这样比较容易装逼。 2025,一种新的味道,半熟的杏,隔夜的茶,冰凉的酒。 总是快的猝不及防,快到来不及回味,总有种跟不上的感觉。最大的追问是:能有几分可以把握的主动?不知道,只是脑海里飘过一首闽南歌曲。 一年又过去,微风吹过,此时此刻,恰如彼时彼刻。只是,没有清冷,只有温暖。 关于网站 2025年初去厦门,回到广州时感觉到一种强烈的孤独和失落,我不知道失去了什么,可能2024于当时的我来说,还是太过沉重。回来之后动手搭建了第一个网站,做点没做的事情整理心情,做的挺花哨,但不实用,后台配置非常麻烦,后期索性直接在flowus记录了。网站就暂时搁置。一年过去,打算重新做一套工作流,要有本地,要有网页,所以重新构建了这么一个框架。在本地写完push就可以自动渲染发布,体验上是不错的。预计2026会在这里发布一些东西,域名没变,浏览器可以直接输入yunfei.life访问。实现在这里基于 Obsidian 与 Hugo 的自动化知识管理系统 关于自己 总结下来,也不多,苏轼最后的一句“着力即差”让我很受益。这是一种表达,一种佛家的表达,正是“执象而求,咫尺千里。花枝春满,天心月圆”。 话是这么说,但偶尔有会觉得有种逃避的意味在里头。究竟是阿Q精神还是我心光明,也在时常反转,说到底,是安慰自己的,人是最会骗自己的,正是:理性从不参与决策,理性扮演的角色是合理化自己感性做出的决策。 半熟的杏,究竟是酸中带甜还是甜中带酸,这不重要,重要的是好吃,不像熟透了的甜的腻,不像完全不熟的生涩,吃的时候不知道的是,牙会被酸到咬不了豆腐。 隔夜的茶,涩,苦,但是回甘。喝一点可以,喝多了恐怕要肚子疼了。 冰凉的酒,冰的刺激和辣的刺激,喝多了,居然会感觉到甜。这是酒的乐趣,但是要记得酒喝多了也伤身。 时间太快,快到反应不及,快到好友逐渐成家,父母鬓已全白,而我马齿徒增。 发展太快,快到学习不及,快到四年前已经是寒武纪,新事物猛然涌现,我只有加紧马力。 生活太快,快到大脑迟钝,复杂程度指数增长,单核的大脑有点跟不上。 面对这无常和快速变化的世界,就算是天才,纵然是英雄,又有几分可以决定可以把握自身命运的主动和能力?我不知道,我能有的答案,只能是:人生海海,爱拼才会赢。 关于未来 未来。这词太大了。 25年前半年去了解了一下脑机接口,做了半年的实习。感受是这方向一定是未来几十年的核心,作为先驱企业还是很有潜力,但是脑机接口避免不了的是伦理问题,死了人怎么办?用目前这样的方式发展脑机,真可以不考虑对人的伤害吗?情理上,确实很难接受。 大模型是另一条路,25年初破圈之后,大模型玩家正式进入了新的时代。细节不可知,但是仅凭薪资和挖人的情况可见竞争之激烈。 似乎都是路,似乎都不是很好。 就技术来讲,这几年爆炸式发展,根本是学不完的。那么,怎么办?我希望做的是可以产生复利的,10年后,20年后依旧对自己有收益的东西。要讲求效率,用最短的时间做最多的东西。复利,什么是复利?说白了就是”透过现象看本质“,就是见相非相。寻找本质的,第一性的,在这个有点草台班子的世界里边寻找一些有意思的东西。 关于人 什么都会变。人性不变。

January 14, 2026

关于MBTI

MBTI是一种巴纳姆效应: “巴纳姆效应”是指当人们认为性格描述特别适用于自己时发生的现象,尽管事实上性格描述中充满了适用于所有人的信息。 MBTI 测试的流行归因于人类的一种认知偏差,称为“巴纳姆效应”或“福勒效应”,即人们很容易相信对自己性格的一般性描述,这些描述非常模糊,可能适合任何人。 当然,把人归类于16种类型本质是一种量化,量化的过程就存在失真,丢失了本真的更多的信息,映射到这样16个维度,并且需要注意的是,I和E。S和N。T和F。J和P。这几种是不是对立的?窃以为不是,不同环境下人的表现是不一致的,就如同i人也有很E的时候,这最多是一种映射。 通过开放性题目的测试结果用数字描述人格,是将复杂的人性变幻成了简单的数字表征,就如同美团的打分机制,很多5.0的餐馆实际体验并不好,再比如微信读书书籍评分,低分书籍未必没价值,高分书籍倒有可能是鸡汤书(正是下下人有上上智,上上人有没意智)。拿到一个评分,就是用获取真实的方式摈弃了真实。 获取的是分数的被评价的虚拟的损失了的真实,摒弃的是复杂的内在的完整的真实。 熊浩在微博的言论: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 有人问MBTI。 是的,这个世界上有越来越多、各式各样的,试图照出“你到底是谁”的镜面。 它们是科学吗? 也许是。 那我们应该笃信它们吗? 不应该。 为什么? 因为,镜子里的你,头发要是乱了,你可以再次梳理。 因为,测评里的你,如果不及预期,你可以诚心改变。 瑕疵,亦是纹理。 木纹斑驳而古雅,石纹坚卓而通彻。 去发挥你的优势,去生长你的技能,而不是屡屡在夜里 攻击、怀疑、抱怨自己心里缓缓淌出的生命纹理。 你也许就是木纹, 但你,远比镜子伟大。 “霍乱人心,倒果为因,师兄如此执着镜像,可笑,可悲。” “那师弟你说,该当如何?” “山川无谱自成绝响,墨线量不了云霞飘荡。纹生天然,不劳镜鉴🙏” 上面说到巴纳姆效应,关于量化的失真。 其实再想来,还有标签化脸谱化,以及【我是我所以我才这样,而非我是这样,我才是我】。 再想想,量化,语言也是一种量化,我们用几千个汉字,几万个单词,对这个真实的连续的世界做采样,难怪会有不精准的地方,MBTI何尝不是? 我是主体,我是自由的。我想我们在描述(标签)之外生存,语言可以完整的描述一个人吗?何况MBTI。此为“墨线量不了云霞飘荡”。

April 14, 2025