越牧的来源如何辨别真伪?越牧卫浴官网
子曰:一图胜千言。“安安小小姐姐”,一个专注于将生活中见闻感想用数据来展现的原创型自媒体。
《增广贤文》,又名《昔时贤文》,或曰《古今贤文》,是成书于明朝期间的一本儿童启蒙读物。
此书名曰“贤文”,即取古今经典诗句,汇集成册。用今天的话说,这叫《古今贤文摘录》。
今日的数据,使用人工智能中的自然语言处理(NLP)技术,对这份流传甚广的百年经典读物,做个小小的分析,将这个文本中那些不为人知的信息,分享给诸位网友。
何谓自然语言处理(NLP),简单来说,让计算机跟人类一样思考和处理语言。
借助计算机强大的运算能力,计算一句话是积极的、消极的还是中性情感,只需要几秒钟时间即可完成。
而人类,要处理这样一份包含上千个句子的文本,可能需要几天时间。
将计算机统计出来的数据,按照情感倾向的特别消极、消极、中性、积极和特别积极,将这千句名言,绘制成比例图。
从图表看,特别消极和消极的句子,总共有300句,占全部句子的比例在30%左右。而特别积极的句子,则有312句,占比在30%以上。
从分布比例来看,这本儿童启蒙读物,还是比较适合儿童那纯洁又美好的心灵的。
提取上述150句特别消极的句子,和312句特别积极的句子,使用自然语言处理的另外一项技术,将各句分解成若干个词语,再统计出各个词语出现的次数。
出现次数越多,在词云图中,字体就越大,效果如下。
在特别积极的句子中,父母、富贵出现的次数最多。看起来,在古人眼中,富贵也是极让人羡慕的。富贵于我如浮云,大抵只是极少数人已经实现的梦想而已。
而特别消极的句子中,君子和小人出现的频率差不多。
最后,来看看那些特别消极的句子和特别积极的句子,分别都有哪些。
有些句子,在我们看来,是比较消极的,但出现在积极的分类里面。这正是现阶段人工智能的弱点之一,自然语言处理(NLP)是人工智能中最为困难的问题之一。
在此分享几个句子:
一,消极的:
1,福满须防有祸,凶多料必无争。
2,教子教孙须教义,栽桑栽柘少栽花。
3,钱多不经用,儿多不耐撕。
4,与人不和,劝人养鹅;与人不睦,劝人架屋。
5,父母恩深终有别,夫妻义重也分离。
这几句,简直比《厚黑学》还厚黑,人情冷暖、世态炎凉,皆是如此,得到最低评分也是理所当然。
二,积极的:
1,受恩深处宜先退,得意浓时便可休。
2,志宜高而身宜下,胆欲大而心欲小。
3,好学者则庶民之子为公卿,不好学者则公卿之子为庶民。
4,夫妻相和好,琴瑟与笙簧。
5,父子和而家不败,弟兄和而家不分。
正能量这几句,于简明扼要之处,点明了为人处世之道。
------------------------------------------
还没有评论,来说两句吧...