虽然这样的研究在前世已经是常规手段,但是这一世的人们哪见过这个?
对于这一世的所有网友来说,对于这些大教授来说,现在已经不是震不震惊的问题了,也不是吐不吐槽的问题了。而是,完全看不懂的问题!
完全看不懂啊!
想吐槽几句,想骂几句,都不知道从何开口!
张教授傻了。
视频里讲解的内容,他听不懂,傻了!
江小白就是三无的这个真相,他更接受不了,更傻了!
他一时间怔在原地,他的认知上,从来都没受到过如此重大的冲击。
“卧槽,他怎么还列上数学式子了呢?”
众教授连忙再次望向手机屏幕!
设有个输入变量x,,,,有n个可能取值分类型变量yy,y,,yn,则根据贝叶斯定理有:yy0x,x,,x,x,,
根据最大后验概率原则,输出变量应预测n个后验概率中最大的概率值对应的类别。
首先将前八十回标记为类别1,将后四十回标记为类别2,进行朴素贝叶斯分类估计。
由表可知,准确率最小值为076000,而最大准确率达1对测试集分类百分之百正确,平均准确率为091609。
假定两种分类方式的准确率总体服从正态分布,因为样本量为1000,属于大样本检验,因此采用z检验。建立假设并进行检验:
0120
112>0
其中,x1091609,x2061587,s21000192,s22000746
既然p是极显著大于p2的,那么就说明前八十回与后四十回的分类方式相比于任意一般的分类方式而言,类别之间的差异性更明显,即前八十回和后四十回文本特征存在显著的差异。
也就是说,从虚字角度分析,前八十回和后四十回,也不是同一作者的手笔。
因此,无论是从高频词汇分析,还是从虚字分析,通过科学方法研究后,我得出以下结论:红楼梦前80回,和后四十回,并不是出自同一人之手。
弹幕上终于松了一口气:
“终于完事了,脑袋里全是浆糊,懵了啊!”
“我刚刚究竟看了个啥?”
“全程懵逼中!”
“我突然想喷几句话,但发现我完全不知道从何喷起。因为我啥啥都没听懂啊!”
“视频还没结束么?哟,才进行了三分之二?”
“还没结束么?”
下面,为了对我的研究成果进行验证,我们引入神经网络。
所谓神经网络是一种利用误差反向传播算法的人工神经网络,可以有效的解决很复杂的有大量互相相关的分类问题
弹幕,集体崩溃了。
“我靠,又来!”
“神啊,救救我吧。”
“请直接说结论!!”
“苍了个天!”
朴素贝叶斯分类器平均准确率为091677,方差为000201而神经网络分类器平均准确率为093513,方差为000175。
因此,我的研究成果是没有问题的。
综上所述,从高频词汇角度研究,我运用各组高频词汇频数变化折线图。从虚字角度,用了朴素贝叶斯和神经网络分类方法,作了组内与组间对照研究。
结果表明,
视频中,三无的语气加重,严肃而肯定:
“红楼梦前八十回与后四十回文本特征存在显著的差异性,即前八十回和后四十回作者不是同一个人!
短视频播放完毕!
富旦大学办公室内,围观的众教授,一头雾水!
此时此刻,他们和所有网友一样,都没看懂。
这个全程运用了统计学、计算机技术等科学手段进行文史研究的方法,对于这一世的人们来说,太超前了。
虽然在前世司空见惯,但是在这一世,所有人是闻所未闻,见所未见!
文娱:开局盘点十大分手诗词提示您:看后求收藏(百发小说网http://www.baifabohui.com),接着再看更方便。