致力于搞分类研究的人,常常会陷入一种状况之中,那就是分得越是细致入微,距离现实的距离就愈发遥远。当从数量多达上万篇的论文里面筛选出几十个分类研究主题的时候,你就会察觉到,学者们对于“贴标签”这一行为,有着一种近乎于偏执的喜爱之情。
分类研究的底层逻辑困境
为何我们非得要将事物去进行分门别类呢,从高校的分类开始,一直到思想政治教育环境的划分,学者们尝试着运用一把理性的刀,去切开那混沌的现实,然而问题在于,现实世界本来就是呈连续状态的光谱,强行划分边界常常会造成认知的失真。
刘法虎于2012年时就明确指出,中国高校分类研究陷入到了困境之中,而之所以会陷入这种困境,乃是由于分类标准跟教育本质之间存在着难以调和化解的矛盾。这种困境在所有的分类研究里面都有所存在,只是很少会有人愿意直接面对它。
朴素贝叶斯的统治与局限
瞧瞧这些年冒出来的论文,从新冠疫情新闻分类,到商品评价情感分析,朴素贝叶斯算法差不多成了万应工具。深圳大学的何凯、国防科技大学的方莹、东华大学的严琼,起码有十几位研究生都在搞“基于朴素贝叶斯的新冠疫情新闻分类研究”。
背后那种扎堆现象之中,存在着学术创新的欠缺。贝叶斯算法确实简单且高效,然而如2023年李璐等人所提出来的三支决策视角,才切实触碰到多分类研究里头的核心难题,即当分类边界模糊之际,我们究竟该怎样去做出决策呢?
从微生物到高等教育
不同类别进行研究时对应的对象之间横亘的跨度幅度很大,这着实让人惊讶不已,啧啧称奇。有在湖南农业大学的刘燕娟以及其他相关人员着重针对放线菌展开分类方面的研究工作。还有章初龙一直专注于木霉属,始终不放松目光紧紧盯在上面。这些聚焦于微观世界范畴内的分类,事实上和抗生素的探寻发掘,以及农业病害的预防、治理有着直接重要关系。
另一边,陈啸等人在思索高等教育分类的顶层布置,从放线菌直至大学体系,分类探究横跨自然科学跟社会科学,然而方法论上的共通之点却很少有人探讨这个情况,,这种撕裂,恰恰就是分类探究难以有所突破的阻碍。
数据时代的分类新挑战
付超于2020年所提出的,那关于数据素养的分类研究,精准地击中了时代的痛点,在大数据时代里,数据已不再属于稀缺资源,然而分类能力自身反倒变成了用以衡量一个人数据素养的关键指标。
但问题出现了,当我们运用算法针对用户开展分类操作时,是谁在制订分类标准呢?邓琦琦在2005年就对信息政策环境的分类予以关注了,如今这个问题变得越发尖锐起来。分类不单单是技术方面的问题,而且更是权力方面的问题,它决定着谁会被看见,谁会被忽略。
教育领域的标签困境
是不是从韩舰针对高校突发事件所做的分类,再到李莹莹依据学生参与度展开的大学生分类研究,教育领域里的分类一直都跟随着争议呢;这么对学生进行三六九等的区分,实际上有助于有的放矢地教学吗。
2020年,朱志江进行高考试题认知目标分类研究时,可能应当去追问,当把复杂的认知过程简化为几个维度之际,教育体系是不是就如此这般将那些无法被分类的创造力给筛除出去了呢。
分类研究的技术迭代
从2001年陈玉敏运用神经网络去做遥感影像分类开始,直至今时基于深度学习存有各类应用,分类技术已然发生了翻天覆地的变化。张庆森等人将朴素贝叶斯应用于结构设计规范分类,王菲借助情感分类实施电商评价分析,技术的边界在持续不断地拓展。
只是技术取得的进步,没办法将理论存在的滞后给掩盖住。吴皋针对朴素贝叶斯算法做了改进,袁家献利用改进后的算法去预测微博行为,这些属于技术层面的修补行径,始终都不能够对一个根本问题作出回答:我们到底是因为什么才要进行分类呢?
当你将这篇文章读完之后,张开手机去瞧瞧各类APP针对你所贴出的标签,诸如美食达人、健身爱好者、新手妈妈。你会认为这些分类,究竟是在助力你更为良好地认识自身,还是在把你装填进他人预先设定好的格子当中呢?欢迎于评论区去分享出你的看法。

