🏷️

个人知识管理中的标签应用指南

个人知识管理(PKM)是一种捕捉我们在日常生活中遇到的想法和见解的做法,无论是从个人经验、书籍和文章中,还是从我们的工作中,并随着时间的推移培养它们,以产生更有创意、更高质量的工作。我在我的在线课程《建立第二大脑》中教人们如何掌握PKM。

通过将我们的知识收集在自己头脑之外的一个集中的地方,我们可以创造一个创造性输出的引擎 —— "第二大脑" —— 来推动事业的发展,建立一个企业,或追求一种创造。通过使这些知识数字化,我们可以获得可搜索性、备份、设备间同步、与他人共享等好处。

但个人知识管理有一个方面我还没有完全解决,那就是标签。过去,我曾严厉地批评过标签,认为它太费劲,过于复杂,而且所需的努力价值不高。我建议人们不要使用标签来管理他们的知识,而应选择笔记本或文件夹。

但从那时起,我改变了主意。经过几年的观察、发现和实验,我开始相信标签可能是使我们的知识集合真正具有适应性的缺失环节 —— 能够即时调整方向和重新配置自己,以实现我们希望追求的任何目标。

如果要释放标签在个人知识管理方面的巨大潜力,需要什么?

有两种基本结构渗透到现实中:层次结构和网络。

我们目前生活在一个 "网络时代",因为互联网和数字技术使人们有能力直接与世界各地的人联系和合作。组织结构图正在变平,社会运动在没有中心化的指导下兴起和衰落,而各种边界也因为互联网的流动而变得更加松散。

我们对网络的迷恋导致了一种普遍的信念,即层次结构的时代已经结束。我们现在生活在一个自我表达的黄金时代,这是网络所特有的。在这种观点中,层次结构本质上是限制性的、压迫性的控制工具,我们应该尽可能地废除,而网络本质上是开放的、民主的个人解放工具。

信息革命的历史讲述了一个完全不同的故事。网络化的信息并不完全是现代的发明,而等级制度也不一定是注定的。它们之间的矛盾和平衡已经存在了几千年。今天我们看到的只是这段历史的最新章节。

定义

但首先,让我们明确一下定义。

层次结构是一个嵌套组的系统。一个标准的组织结构图就是一个层次结构,员工被归入业务单位和部门,向一个中央机构报告。其他类型的层次结构包括政府官僚机构、生物分类学和软件程序中的菜单系统。层次结构本质上是 "自上而下 "的,因为它们的设计是为了从单一的、有特权的位置实现集中控制。

image

相比之下,网络没有 "正确 "的方向,因此没有底部和顶部。网络中的每个个体,或 "节点",都在自主运作,协商自己的关系并凝聚成群体。网络的例子包括一群鸟、万维网和邻里的社会关系。网络本质上是 "自下而上 "的,因为它的结构是由小规模的互动有机地产生的,没有中心化的指导。

image

这两种结构并不相互排斥 —— 事实上,它们到处都是共存的。一家公司可能有一个等级森严的正式组织结构图,但同时,它又被员工之间不尊重官方界限的 "影响关系 "网络所渗透。

在等级制度中,有一个网络。

即使是互联网,作为纯网络的最典型的例子,也需要等级制度来运作。向我们发送数据的服务器是按层次组织的,它们发送的数据包也是如此。允许我们浏览网页的网络浏览器是分层设计的,我们通过导航来寻找我们要找的东西的菜单也是如此。

网络中存在着一个层次结构。

层次结构和网络不断地相互促进生长

网络和等级制度不仅和平共处,而且不断地相互促进。它们就像共生的有机体,每一个都在平衡和补充着另一个。

关于地球上生命起源的一种理论设想,第一批多细胞生命形式是由较简单的单细胞生物组成的自组织网络。最初聚集在一起交换副产品和相互保护,随着时间的推移,出现了一个等级制度:一个复杂的神经系统。这些复杂的生物体反过来又凝聚成更高阶的社会网络,提供更多的生存利益。

长期以来,在线百科全书维基百科因其众包的知识收集方式而备受赞誉。但近年来,维基百科的快速增长迫使它发展出一系列的等级控制系统,如管理机构和审批程序。网络可以自我组织并催生新的想法和联系,但需要一个等级制度来赋予其形式和结构,以便长期生存。

正如John Seely Brown和Paul Duguid在《信息的社会生活》中写道:"虽然很明显,自我组织是非常有成效的,但正式组织也是如此。事实上,两者进行了复杂(和动态)的平衡,各自弥补了对方的不足之处。自组织克服了正式组织的僵化。正规组织遏制了自我组织的自我毁灭倾向"。

层次结构对于在相对可预测的环境中的大规模、缓慢移动的工作是有效的。他们能够集中指挥,并在许多移动的部分之间进行紧密的同步。在指挥和控制战争、大规模生产标准化产品或管理一个庞大的官僚机构的时候,只有层次结构才能发挥作用。

网络在小规模、快速变化的情况下,在不可预测的环境中表现良好。它们有利于适应性、灵活性和个人自主性。在游击战、革命创新或无限制的创造时期,网络是不可缺少的。

层次结构和网络相互平衡

纵观历史,每当我们达到一种形式的极限时,另一种形式就会作为一种平衡而出现。

弗朗西斯 · 培根的科学方法在17世纪首次提出,是一种自下而上的、网络化的方法来建立科学理解。科学家们被期望得出自己的结论,然后通过学术网络直接验证彼此的工作。这种方法与从教会和国家等等级当局接受知识而不加质疑的传统形成对比。

在18世纪,由丹尼斯-狄德罗(Denis Diderot)最著名地推动的百科全书运动朝相反方向发展。如此多的知识从如此多的来源产生,人们寻求一种自上而下的分类方法来理解这一切。因此,现代的百科全书诞生了。

在现代,我们面临着类似的困境。互联网上数字信息的爆炸性增长已经淹没了我们对其进行分类和归类的所有工具。只有自下而上的自动化工具才有能力对如此多的数据进行理解。谷歌的PageRank算法使得不是通过人类的判断,而是通过分析关键词和超链接来赋予网页的重要性和意义成为可能。这是一种自下而上的算法方法,从网络中产生意义。

层次结构是有弹性的

尽管网络在信息时代很受欢迎,但层次结构作为组织知识的一种简单、一致的方式仍然存在。

许多研究(Bergman等人,2008年;Fitchett和Cockburn,2015年;Teevan等人,2004年)都发现,相对于搜索,人们更喜欢手动导航他们的文件系统,扫描他们要找的文件。手动导航给了人们一个具体的导航结构,文件夹和标签给了他们视觉上的反馈和增量步骤的控制(Jones和Dumais 1986)。

搜索依赖于陈述性记忆 —— 记住并输入文件的精确内容 —— 这是一种更高层次的大脑功能,会消耗大量的能量。另一方面,人工导航依赖于程序性记忆(Barreau 1995)—— 指定部分信息,识别线索和背景,并接受反馈(Teevan等人,2004;Jones 2013)。这种记忆使用了大脑中为导航空间环境而开发的 "老 "的部分,因此更自然地来到我们身边。

换句话说,很明显,层次结构并没有消失,哪怕我们的搜索工具变得越来越强大且复杂。

但层次结构系统的弱点是,知识仍然与其他可能引发有趣联系的想法隔绝。在我们的文件系统中添加一个网络可以帮助我们保留层次结构的好处,同时为其注入交叉连接和关联。

这就是现代数字时代的标签的真正目的。不是为了取代层次结构,而是为了补充它。标签允许我们创建替代性的路径,以隧道方式穿过我们孤立的文件夹的墙壁,同时让它们和我们离开时一样。

通过我们的知识联系将标签视为 "隧道",使我们能够利用我们对人类与物理空间关系的丰富理解。隧道有一个开始和一个结束,一个顶部和一个底部。我们在隧道里穿梭自如。

通过给相关的笔记集合添加一个标签,你可以更容易地将它们视为一个连贯的群体。它们在你的笔记中(以及在你的头脑中)占据了一个 "空间",使它们更容易被检查、连接、分享和参考。这样一来,标签的作用就像真正的空间组织,无需将任何东西从一个地方移到另一个地方。

在他的经典论文《空间的智能利用》中,David Kirsh描述了物理空间可以被利用的三种基本方式。

  • 简化认知:比如把洗好的蘑菇放在砧板的右边,把没洗的放在左边。
  • 简化选择:如按照需要的顺序摆放烹饪材料。
  • 简化思考:如反复重新安排拼字游戏的顺序,以促使产生新的词汇。

这些都是标签所提供的能力:它们帮助我们感知、选择,并在跳跃性的思考数据之间新的关系。但关键的是,做这些事情是为了促进行动,而不仅仅是抽象的思考。

在不同的笔记本上给笔记打上标签,可以让我们察觉到跨学科的主题和模式,而这些主题和模式是无法简单归类的。给我们想为一个项目复习的所有笔记贴上标签,可以使我们的选择更容易,因为它为我们在采取行动前要考虑的信息创造了一个界限。根据项目的哪个阶段来标记笔记,可以让我们只关注特定时间内最相关的信息,从而改善我们的思维。

安迪-克拉克(Andy Clark)在他的《思维的超限》(Supersizing the Mind)一书中,将 "简单的标签"(或标签)描述为一种 "增强的现实技巧"。通过给事物贴标签的简单行为,我们邀请大脑的模式识别能力来识别它们的相似性,从而预测其他物品也会适合这个标签。我们本质上是在调整我们笔记的信息环境,以突出或压制与手头任务最相关的特征。我们的思想塑造了环境,而环境又塑造了我们的思想。

通过将标签视为我们可以即时创建的虚拟空间,我们利用了人类对空间导航的直觉来理解复杂、抽象的主题。我们能够创建更具体的概念结构,并使用我们的程序性记忆来对他们进行导航。

下一个问题是,"我们想用这些空间做什么?"

尽管把标签看作是 "虚拟空间 "很有用,但这仍然给我们留下了压倒性的复杂性。概念空间是巨大的、不断变化的和复杂的。历史上每一次为所有人类知识创建 "通用分类法 "的尝试都是失败的,这证明了这项任务是多么的困难(或不可能)。

我认为,标签要发挥其潜力,同时保持可行性,需要的是改变其功能:从标示知识位的 "概念意义 "(这是劳动密集型、耗时和脆弱的),到追踪其生命周期

什么是 "知识生命周期"?

它是知识在成为成品的过程中所经历的一系列阶段。这些阶段根据成品的具体内容而有所不同,但可以包括:

  • 识别知识
  • 捕获知识
  • 核实知识
  • 解释知识
  • 组织知识
  • 对知识进行分类
  • 传播知识
  • 融合知识
  • 创造知识
  • 使用知识
  • 重新评估知识
image

这些阶段的关键特征是,它们的数量相对较少,而且变化缓慢。创造性的产品是不断发展和变化的,但创造性的过程是古老和不变的。通过根据这个过程的各个阶段进行标记,我们可以促进创造力,而不必不断重新设计我们的组织系统。

这个想法并不新鲜。1969年,罗伯特-霍恩首次发表了一篇论文,概述了 "信息映射 "作为创建技术参考书的新方法。这是一个识别、分类和相互关联信息的原则体系,使人们在复杂的、信息丰富的环境中更容易学习。它首先被应用于军事和计算机教学,后来又被应用于其他几十个领域和场景。

信息映射的核心,是项目生命周期的方法。它假定知识收集的首要目标是将其用于实际项目中。但是没有一个固定的、预先确定的用途。同一块知识可能在不同的时间以不同的方式被使用。比如说。

  • 首次学习
  • 再学习或回顾
  • 参考资料
  • 简报和浏览
  • 根据变化进行更新
  • 作为工作辅助工具使用(检查清单、目录或协议)。

所有这些活动都可能使用相同的知识点,但使用的方式和详细程度不同。一本培训手册必须能够根据不同类型读者的需求进行调整和重组,而不是提供一个 "一刀切 "的版本。霍恩对这一挑战的解决方案是 "信息块" —— 将知识组织成标准化的 "块",可以混合和匹配以适应特定的需要。

信息块取代了段落,成为意义和表述的基本单位。非结构化的信息被 "集中 "到有明确标签的信息块中,这些信息被连接起来,并在写作过程中进一步完善。

霍恩和他的合作者确定了40种类型的信息块,可以归为七种类型之一。

  1. 程序 Procedure
  2. 过程 Process
  3. 概念 Concept
  4. 结构 Structure
  5. 分类 Classification
  6. 原理 Principle
  7. 事实 Fact

这些类型在所有种类的主题和项目中都是标准化的。霍恩和其他人的研究表明,几乎任何主题事项的80%都可以用这个系统进行分类。人们发现,在项目的早期以这种方式对信息体进行分块,在随后的每个阶段都有巨大的好处。

从表面上看,信息图谱的设计是为了使作者的工作更容易,它规定了为特定文件收集和呈现正确信息的标准化方法。但它也使读者的工作更容易。由于每个信息块都根据其类型和目的进行了标注,读者能够扫描一个信息块并迅速了解其内容和结构。这使他们能够定制学习过程:如果是第一次阅读,他们可以从头到尾阅读,如果他们已经熟悉了这个主题,则可以直接进入与他们的需求最相关的部分。这些标签使他们更容易管理所读内容的中间阶段,增加了读者对自己理解和利用文本能力的信心。

信息图谱是向 "即时学习(Just-in-Time Learning) "迈出的重要一步。与其给读者一个庞大的文本,并期望他们在未来某个不确定的日期之前将其全部记住,不如将信息结构化,以便在需要时快速有效地检索。

信息映射在标签方面能给我们什么启示?该领域数十年的研究表明,标签的最佳用途是作为一种输出机制,而不是一种输入机制。霍恩的突破在于区分了信息的两种非常不同的功能 —— 学习和参考 —— 并认识到我们需要启用灵活、动态的方式来重新组织信息块以适应这些不同的需求。

通过在我们的笔记被使用时而不是创建时为其贴上标签,我们将标签的工作尽可能地靠近它所要解决的问题。通过使这项工作以项目的执行为条件,我们确保花在标记上的每一点努力都能得到利用。

在此基础上,以下是我对如何在个人知识管理中有效使用标签的四个建议。

#1 根据所采取的行动或用其创造的成果来标记笔记

我的第一个建议是改变标签的功能,从试图描述 "心理学 "和 "投资 "这样宽泛的主题转变为追踪某条信息的用途或功能。这可以包括对笔记进行标记。

  • 按行动 - 你对这一笔记采取了(或将采取)什么行动?
  • 按交付物 - 你用(或将用)这个笔记来交付什么?
  • 按知识生命周期的阶段 - 这个笔记目前处于哪个阶段(或它最好属于哪个阶段)?

标签应该回答 "这与我目前的需求有关吗?",刚好可以让下一步行动变得清晰。不要让你的想法被层层的类别和分类困住。让它们快速通过你的创意过程并进入现实世界。

下面是几个根据知识块的用途或功能来应用标签的例子。

  • 标签[已审查]和[已添加],用于跟踪哪些笔记已被审查,哪些已被纳入交付物中。
  • 指定一个笔记所包含的信息的标签,如[内容]、[管理]和[会议记录]。
  • 追踪笔记在工作流程中的状态的标签,如[非活动]、[活动]、[下一个]和[完成]。

下面是我在一年中收集的与我的在线课程构建第二大脑有关的笔记的例子。在右边一栏中,你可以看到一些不同类型的标签,我用这些标签将这些笔记分成不同的类型。

  • [Reviewed]意味着我已经看过它,并考虑在课程中使用它;[Added]意味着我已经以某种方式将它纳入课程。
  • [Admin]指定不包含主题内容,但用于计划或技术信息的笔记。
  • [PARA][PS]和[JITPM]指的是课程的三个主要部分,允许我每次只考虑一个部分的笔记。
  • [basb]指的是我想为我正在写的关于同一主题的书考虑的笔记;这让我可以为不同的项目 "提取 "笔记的子集,而不需要从这个笔记本中删除它们。
image

请注意,这些标签并没有告诉我每个标签包含什么,也没有试图给它们贴上各种可能的关联。它们所做的只是促进它们被纳入一个具体的项目中,也就是我的在线课程。因为需要的标签很少,所以我可以同时使用几种不同的标签,而不会使笔记本变得杂乱。

我可以对这些标签之一进行搜索,并点击这个按钮,只显示这个笔记本的结果。

image

在这个笔记本中,我只看到了带有[admin]标签的笔记。

image

这种标签的使用让人想起丰田的及时生产系统中的 "看板 "卡。一张简单的卡片代替了详细记录中每一个零件的长而复杂的表格,一目了然地揭示了最重要的事情:它是什么,它去哪里。

image

丰田为什么要创建这样一个卡片系统?为什么不能简单地将每个零件按照正确的顺序放在装配线上?

在战后的日本,没有足够的工厂,也没有足够的需求来证明将整条生产线用于生产一种型号的汽车,就像美国福特的T型车那样。看板卡的用途之一是在工厂中追踪一件物品,无论它经过哪台机器,以什么顺序,以什么速度。每个物品都被 "标记 "为其当前的状态,所以对于如何处理它从来没有任何疑问。

这与我们今天作为知识工作者所面临的情况基本相同。我们很少有足够的需求来专门从事某项活动,而是在不断变化的不同项目和活动的组合中工作,这些项目和活动的波动是不可预测的。而这些活动使用同样稀缺的资源 —— 我们的智力、时间、精力和技能。

我们应该像丰田公司使用看板卡一样使用标签:创建相互交织的网络,在适当的时候从我们的 "库存"(或知识收集)中提取适当的 "零件"(或笔记)。我今天在阅读一本关于财务规划的书时,应该能够捕捉到一个笔记,并知道它将在我需要对该主题的洞察力时出现,无论那是下周、下个月还是明年。标签应该准确地记住我离开的地方,这样我就不必记住了。

通过标签,我们有机会将我们的知识联网。但这些网络不应该仅仅是概念性的。它们应该是生产网络,通过我们的创作过程,把我们的想法推到可以从中受益的人手中。

这种标记方法解决了我在标记已坏中指出的标记的每一个隐患。

  • 标签应该容易记忆:由于你对笔记采取的行动数量有限,你只有少量的选项需要记忆。
  • 标签应该容易决定:通常更容易决定一个笔记如何使用,而不是它的意思或它的内容。
  • 标签应该是具体的:根据行动和可交付的成果进行标记,远比理论上的分类更具体。
  • 标签应该促成正确的行为:在这种情况下,使用标签来管理工作流程的各个阶段,可以使知识得到有效利用,而不仅仅是编目。
  • 标签应该是兼容的:通过维护标签作为分层组织系统的补充,我们可以获得大部分的好处,而不需要完全遵守它们。

#2 慢慢地、分阶段地、仅在需要时增加结构,用积累的材料来指导你需要什么结构

在组织知识时,非常诱人的做法是先决定一种结构,然后无论如何都要坚持下去。虽然一致性有好处,但当涉及到个人知识管理时,最重要的是它要适合你的日常需要。即使是完美的组织系统,如果你停止使用它,也是不完美的。

数字信息最宝贵的特点之一是它具有高度的可塑性。它几乎可以在瞬间改变形式,只需点击几下就可以了。我们可以利用这种可塑性,随着我们对某一主题知识的积累和需求的变化,逐步增加结构,小步快跑。

例如,如果我对学习西班牙语度假感兴趣,我可能会把我学到的一些有用的西班牙语单词保存在我的 "旅行 "笔记本中。在这一点上不需要结构,因为我对这个主题的所有了解都包含在一个笔记中。

image

但是,假设我有这样一次愉快的旅行,我决定要探索搬到墨西哥的可能性。我开始收集笔记,包括旅行装备、解释如何租房的博文、手机计划的选择、签证申请表、以及申请哪种信用卡的指南等等。最初的那个 "西班牙语词汇 "笔记现在只是众多笔记中的一个。这些知识的用途已经改变。在这一点上,创建一个名为 "移居墨西哥 "的新笔记本(根据我的PARA方法论,这是一个 "项目")并将这些笔记移入其中是有意义的。

image

经过几个月的研究,我可能已经收集了几十份笔记,笔记本可能开始变得太杂乱,无法找到我所要的东西。在这一点上,我可以很容易地对笔记本进行 "分割",根据[apartment], [language], [logistics], [financial], [gear], [research], [writing] 等广泛的类型来标记笔记。我建议使用少量的类型,这样你只要看一下标签栏,就能一目了然地看到你的选择。

点击右栏顶部的 "标签 "标题,将根据类型对笔记进行排序,这可以让你在一个地方看到相关的笔记,同时将它们放在同一个笔记本中。

image

假设几个月过去了,现在我真的在墨西哥城生活和工作了。在这一点上,一个笔记本已经不能涵盖在一个新城市生活的许多方面。我需要创建几个新的笔记本,包括 "寻找健身房 "和 "激活手机服务 "等项目,"公寓 "等责任领域,以及 "墨西哥食物 "和 "西班牙语 "等资源。

如果我事先创建了所有这些笔记本,那就没有意义了,因为我在这些笔记本中要存储的东西太少了。一旦相关的类别显示出来,就可以毫不费力地将笔记移到这些新的笔记本中(右击>移动笔记到...)。

image

通过这种方法,我只在学习旅程的特定阶段增加所需的结构。这有助于确保我把大部分时间花在接触内容上,而不是维持一个复杂的组织系统。你会认为以后添加结构会更困难,但事实上更容易:我可以看看我已经收集的内容,然后挑选完全适合它的类别,而不是试图猜测将需要哪些类别。

你怎么知道要使用哪些部门或类别?还是那句话,与其事先猜测,不如从最懒惰的方法开始:简单地收集关于某个特定主题的任何看似有趣的东西。当时间到了,也只有当时间到了,看看你已经有机地收集到的东西,寻找模式。这样做的最佳时机是在开始一个可能会用到这些笔记的项目时,因为通常情况下,项目本身就会产生一些划分。

例如,假设你被一家公司雇用来改善他们的招聘过程。如果这是你提供的一项服务,你可能有几十甚至几百条与招聘有关的笔记。但项目的组织方式往往会告诉你哪些部分或阶段是最相关的。也许合同被分成了 "简历收集 "和 "面试"。通过回顾你的笔记并给它们贴上这两个标签,你可以非常迅速地按照这些思路重新调整你与招聘有关的笔记。使用与项目结构相匹配的组织方案将使该项目更容易执行。

只要我从一批真正的笔记开始,我就会不断惊讶于划分的清晰程度。如果我在真正收集到任何东西之前就试图理论化地确定正确的标签,那么它总是偏离目标。数字信息的神奇之处在于,它可以很容易地、无摩擦地进行这种回顾性的改变。这种向后看的重组也使我们能更快地进入新的主题:当我对某件事情感到兴奋时,我不会把宝贵的精力花在设置上,而是直接投入到主题的中心,捕捉任何看起来有趣的东西,并相信我可以在以后把它整理出来。

这种方法还有另一个好处:完全不标记一个笔记也是完全可以的。只要你不使用标签作为你的主要组织系统,没有标签的笔记就不可能完全被遗漏。它将永远在你留下的笔记本中存在。这就避免了令人沮丧的经验,即强迫自己为一个笔记想一个标签,即使没有想到什么,因为否则它就会完全丢失。

这里的教训是,不要在需要之前创建结构。通过在适当的时候添加足够的结构,维持结构所需的工作将总是感觉是一种受欢迎的缓解,而不是沉重的负担。

#3 根据其内部、外部和社会环境以及顺序来标记笔记

Ofer Bergman和Steve Whittaker在他们的《管理我们的数字东西的科学》一书中(本文中的所有研究都来自该书),确定了一条信息的四个属性,可以用来描述其 "背景"。

  • 内部环境:包括你对一个笔记的想法、感觉、联想、关注和考虑。
  • 外部环境:包括你在与笔记互动时处理的其他项目,如其他笔记、文件、文件夹或应用程序。
  • 社会环境:指的是与笔记有关的其他人,例如项目合作者、推荐来源的人或与之分享的人。
  • 当前状态:指的是对该笔记采取的任何行动,或者它被用于任何交付物。

这些属性是通用的,因为它们适用于任何来源的任何种类的笔记,但也易于应用。它们并不试图描述笔记的内容;只是描述其背景。这些并不是需要深入思考的抽象标签。它们是简单的问题,可以通过观察你正在做的事情来回答。它们可以根据需要逐步添加。它们将使你能够更容易地回到你上次与纸条互动时的心境,使用我们的大脑所能理解的上下文线索。

这里有一个Evernote笔记模板,可以用来在任何笔记的顶部添加这四种语境,包括我制作的关于如何将笔记作为模板保存到你的账户的简短视频。下面是一个填写模板的例子。

image

#4 开发定制的、针对特定行业的分类法

组织信息的历史主要涉及 "分类法"—— 在一个包罗万象的模型中对信息进行分类的分层系统。

关于哪个是 "正确的 "分类法的激烈争论可以追溯到几千年前。亚里士多德认为,知识可以根据它的实质、数量、质量、关系、地点、时间、位置、状态、行动和激情来分类。弗朗西斯-培根将所有人类知识分为记忆(即历史)、理性(即哲学)和想象(即美术)。20世纪的印度图书管理员Shiyali Ramamrita Ranganathan认为,任何文件都可以根据其个性、物质、能量、空间和时间来定义。

我们的目标一直是创造一个单一的、完全全面的知识排序,任何未来的想法都可以被放入其中。但是几百年来,随着我们的知识在规模和复杂性上的爆炸性增长,建立一个通用分类法的可能性已经消失了。现在很清楚的是,任何这样的分类法要么过于宽泛而无用,要么过于狭窄而不具普遍性。通用分类法的梦想已经破灭。

但是对于特定的领域和专业,分类法显然有巨大的价值。如果没有林奈的分类法,生物学将是一个无望的重叠专业的纠结。如果没有周期表,化学将是徒劳的。如果没有流派和时期,艺术的趋势将是不可能理解的。只要你能依靠商定的术语的 "受控词汇",把所有东西归入一个类别就很有意义。

我的一个课程中的一个学生解释了他写脚本的系统(重点是我)。

如果你知道你的特定艺术形式的构成部分是什么,你可以在一个笔记本中收集任何一个艺术形式的唤起性想法的 "片段",并使用标签来标记它们。因此,例如,我有一个 "电影创意 "文件夹,我在那里储存创意,然后用以下标签标记它们。

  • C = 可用于故事的人物描述。
  • L = 有趣的和视觉的地点。
  • O = 好奇的或令人回味的物体。
  • S = 丰富的或揭示性的情况。
  • A = 不寻常的或揭示性的行为。
  • T = 任何使你感兴趣的主题或你在生活中看到的体现。

然后我可以看到所有这些笔记并排在一起,如果任何特定的元素组合让我印象深刻,我就有了一个故事创意的雏形。"

这样的分类法甚至可以比你的领域或职业更具体,因为你是同一个人在记录和检索这些知识。它们可以是 "personomies",或个人标签词汇表,包含你用来指称你工作的各个部分的术语。这种personomy是你必须自己开发的东西,但你的专业或行业是一个很好的开始。

根据我的经验,只有在你的收藏变得很强大的时候才有必要使用标签。经过近10年的笔记工作和8000多条笔记的创建,我刚刚开始严重地碰到了无标签系统的局限。

这一发现在研究中也得到了回应。在20世纪60年代和70年代,IBM公司用他们新的存储和信息检索系统(STAIRS)进行了一系列的实验,这是第一批计算机可以搜索整个文件文本的系统之一。他们发现,搜索的准确性可以达到75%到80%。他们高兴地宣布了 "元数据的死亡"。如果计算机可以直接搜索所有的东西,为什么还要花时间和金钱让人类对文件进行索引呢?

但这些实验有一个致命的缺陷。他们使用的是只包含几百个文件的小型集合。人们认为,只要他们有足够的计算机能力,这些结果将同样适用于大型文集。但这是一个语言问题,而不是一个计算机问题。

20世纪80年代,研究人员David C. Blair和M.E. Maron测试了一个全文本诉讼支持系统,其中包含约40,000份文件,35万页文本。律师们依靠这个系统来检索所有可能帮助他们赢得案件的文件。但布莱尔和马龙的研究表明,召回率平均只有20%左右。该系统只检索到每5个相关文件中的1个! 而这是在训练有素的研究人员的情况下。

麻烦的是,语言有无数的、往往是模糊的、重叠的对概念的映射。正如大卫-布莱尔讲述的一个真实例子,一个有1000份文件的系统中,有100份包含 "计算机 "这个词,这个词有10种不同的用法。但在一个有100,000份文件的系统中,有7,100份包含这个词,而且有84种不同的使用方式。可能的含义和解释的数量几乎和信息本身一样快地爆炸开来。

这就是标签的作用。它们可以提供计算机仍然无法确定的重要的缺失数据:一个笔记是关于什么的。只要你遵循本文的建议 —— 使用标签来追踪知识块在知识生命周期中的位置,缓慢而渐进地添加结构和标签,并为笔记添加上下文数据 —— 你就可以为未来的自己创建行动路径,而不会被僵化的官僚主义所累。

在个人知识管理方面,我们既需要层次结构也需要网络。笔记本允许我们在一个地方收集一批相关的材料,并寻找我们所收集的东西之间的模式和关联。标签为这个层次结构添加了一个网络 —— 一个可以更有效地将我们的想法输出到外部世界的分发网络。

"环境可寻性 "是信息架构师Peter Morville在同名书籍中创造的一个术语。它描述了创造可以找到和使用相关信息的环境的做法,无论是图书馆还是智能手机。当一个项目是 "可找到的",这意味着它很容易被发现和定位。

在这样的环境中导航的关键技能是寻路,它指的是 "人们为了从一个地方到另一个地方,不管是在内部还是外部,所知道和所做的一系列事情"。这是一种我们为导航物理环境而开发的技能,后来我们将其应用于虚拟环境。但我们创造的虚拟世界缺乏我们在自然界所依赖的自然地标。它们缺乏树木、河流、海岸和路径。在数字世界中,我们必须自己创造它们,用文字来表达。

但我们过去使用标签的方式来自不同的时代。莫维尔讲述了他在密歇根大学信息和图书馆研究学院的 "在线搜索 "的记忆,那是在1993年的古老时代。

"我们通过连接到Dialog公司主机的哑巴终端机进行数据库搜索。结果被输出到一台点阵打印机上。而Dialog公司是按分钟收费的。这使搜索工作变得相当紧张。错误的代价是时间和金钱。因此,我们会事先在图书馆花上一个多小时,查阅印刷的描述词表,考虑如何最有效地组合布尔运算符,并制定我们的整体搜索策略。计算机的时间比人的时间更宝贵,所以我们对每一个关键词都很在意。

精心设计的精确标签系统在当时是有意义的,因为当时每项操作都要花钱。但今天的挑战不是节约计算机功率,而是花费它。与其为了让计算机的工作更容易而浪费人类宝贵的时间去做费力的标记,我们应该慷慨地花费计算机的力量来让我们的工作更容易。

感谢Andrew Brož、Chris Harris、Sachin Rekhi和Jessica Malnik的反馈和贡献

Subscribe below to receive free weekly emails with our best new content, or follow us on Twitter, Facebook, Instagram, LinkedIn, or YouTube. Or become a Praxis member to receive instant access to our full collection of members-only posts.

精选集