第064章用科学方法解读红楼梦(第1/2页)_文娱：开局盘点十大分手诗词

    《盘点历史十大伪作（1）》一出，顿时引起了无数网友的关注。

    东门庆工作室。

    “庆哥，三无出山了？”

    “啊？他不是不再盘点诗词工作了么？出尔反尔？又出来盘点诗词了？”

    “没，他这次盘点了历史上的伪作，说《红楼梦》是伪作。”

    “啥？卧槽啊！准备文稿，以前咱们一直是歌颂他的，这次准备开喷吧！争取做出全网第一条批判他的短视频！”

    ……

    片场。

    宋乔芸正坐在椅子上休息，身边的化妆师在补妆。

    滴！

    【抖乐提示：您关注的短视频博主发布了最新作品。】

    她连忙打开手机，见到印入眼帘的一行字后，整个人瞬间绷直了。

    “这……”

    “完了，歪了歪了歪了！”化妆师忙道。

    宋乔芸沉吟道：“三无的观点，未必是歪的。”

    “我是说口红给您画歪了。”

    ……

    富旦大学。

    张教授正在和同事们畅聊历史。

    突然有人匆匆跑来：“张主任，我万万没想到，您口中的那个朋友，竟然是三无老师！”

    张教授一脸茫然：“什么东西？”

    “您朋友啊，您不是说您有个朋友嘛，我做梦都不敢想，您口中的那个提出了《后出师表》伪作言论的朋友，竟然是诗人三无！张主任，您也太低调了吧，认识三无都不跟我们说？”

    张教授很茫然：“啥意思，我不懂你啥意思。”

    “您还装！这不嘛，您朋友三无老师，刚刚发布了一条短视频，您看啊，这上面不是写着呢么，《盘点历史十大伪作（1）》，《红楼梦》，他前几天不是还说《后出师表》是伪作嘛！您可千万别告诉我，这是两个研究者碰巧想到一块去了，都研究同一个方向了。”

    张教授脑袋“嗡”地一声，他突然意识到了什么，但又完全不敢相信。

    他一把抓过手机，因为激动手都是抖的，只见屏幕上徐徐展示出一段内容，然后他整个人，彻底懵住了。

    ……

    无数双眼睛在不同时间盯着同样的内容，有着同样的震颤，这是一个挑战了所有人固有认知的短视频！

    短视频在缓缓播放着内容。

    三无极具特色的嗓音，舒缓平和，娓娓道来。

    【我将《红楼梦》分为两部分，第一部分：前80回，第二部分，后40回。

    在经过我缜密而繁复的研究工作后，我发现了一个惊天的秘密——《红楼梦》后四十回，其作者并不是曹雪芹，而是由后人续写，狗尾续貂之作。】

    抖乐最近学习了其他短视频网站，开通了弹幕功能。

    此时满屏幕的弹幕全是问号。

    “？？？”

    “啊？？？”

    “三无，请回去写你的诗词吧，别在这逗我好么？”

    “这不扯淡呢么？”

    “现在的自媒体，为了流量真是啥瞎话都敢编啊！”

    ……

    视频内容继续：

    【接下来的一段时间里，我将分若干集，从各个角度出发，来论证《红楼梦》后四十回并不是曹雪芹手笔。

    而本集视频，我们先从文本特征差异研究开始。我将运用统计学方法，并结合R语言技术，对我的观点进行阐述！】

    弹幕上，网友们又蒙圈了。

    “R语言技术？统计学？跟《红楼梦》有什么关系？”

    “什么是R语言？”

    “这不是文学方面的事情么？怎么涉及到数学和计算机技术了呢？”

    “对啊，文学就是文学，怎么能和其他学科混为一谈呢，一看就不靠谱！”

    “继续围观，看这个诗人能扯出什么花样来。”

    ……

    【在大量事件的前提下，无论是在语言表述，还是在写作中，每个人在特定情况下用字或是用词都存在着某种规律。

    这种规律便是个人在说话与写作中所形成的语言表达习惯，即是个人在其特定习惯中所形成特有的文体特征。

    所以，不同的作者在用词频率与用词风格上存在一定的差异性。

    我将运用R语言对《红楼梦》著作进行文本分词和词频统计，从高频词汇和虚字两个研究角度，来分析《红楼梦》前八十回与后四十回在文本特征上的差异性。

    首先，我们率先研究高频词汇。

    在《红楼梦》的高频词汇中，我首先将人名、地名、称谓等剔除掉，以及对“一个”“一面”等表数量的没有实际意义的词汇进行剔除。

    于是，我们得到了65个高频词汇进行文本研究，现制作统计表格。

    如下图！】

    短视频中，贴出一张统计表。

    【高频词汇研究对象表】

    【1，什么；2，我们；3，那里；4，姑娘；5，你们……63，家里；64这话；65到底。】

    短视频解读继续：

    【……我的研究分组方案如下，一至三十回第一组，十六至四十五回第二组，三十一至六十回第三组……，以此类推，一共将《红楼梦》分成7组。

    运用R语言，对各组进行分词，对高频词汇研究对象进行词频统计。绘制高频词汇频数变化折线图。

    如下图所示！】

    话音落，短视频里，贴出了运用R语言绘制出的高频词汇频数变化折线图——一个带有X、Y坐标的七条折线的统计表。

    而此时，网友们全看傻了。

    “懵逼了，这些都啥意思啊？”

    “这能代表啥啊，根本看不懂啊！”

    “诗人你到底啥意思，请你明说行么？”

    “我感觉看了你的视频，受到了侮辱！”

    “你高估我们了！”

    ……

    短视频开始对这一折线图进行讲解：

    【我们可以发现折线图有明显的锯齿形，那么就表明高频词汇在各分组有明显的波动……诸如16（没有）、21（听见）、26（回来）、34（心里）、51（那些）、65（到底）等词汇，当第六组和第七组出现波峰的时候，其他组却出现了波谷；

    而在42（不过）、61（姊妹）等词汇，当第六组和第七组出现波谷的时候，其他组却出现了波峰；这就说明第六组和第七组的折线图与其他组的折线图有明显的相反的走势……】

第064章 用科学方法解读红楼梦(第1/2页)

第064章用科学方法解读红楼梦(第1/2页)