用余弦定理+大数据找到心仪的对象
![](/img/1.jpg)
前言
余弦定理和找对象似乎是两件八杆子打不着的事,但是它们却有着类似于余弦定理和Google的新闻自动分类一样的紧密联系。具体来说,找对象也可以和做Google的新闻自动分类一样,找到最契合的另一半。
原理
找对象之前,先来看看文章自动分类的原理,我们做文章自动分类时,第一步是从分词入手
第一步,分词
这里使用了一个Node.js比较成熟的分词库,底层算法是基于c++做的实现,性能不错。
JAVASCRIPT
1 | /** |
第二步, 列出所有词
分词之后我们将得到所有的词
JAVASCRIPT
1 | /** |
第三步,统计词频率
当我们拿到所有词的数组后,还需要进行词频统计,EXCLUDE_WORDS_ARRAY
这个是我们排出的一些语气助词。
JAVASCRIPT
1 | /** |
第四步,根据词频向量计算相似程度
1 | 句子A: "太阳刚升起夕阳已落下" |
通过计算,我们会得到这样一个词频数组
结合余弦定理:
对于n维向量的计算如下:
而计算出来的余弦值越接近1,则表明夹角越接近0度,也就是两个向量越相似。
JAVASCRIPT
1 | /** |
找对象
和做文章自动分类一样
第一步,基本信息、个性、兴趣爱好分析
和分词原理类似,我们要将每个人的物理数据数字化,并按照不同的维度拆分
第二步,列出所有数字化后的数据
分析之后,我们将得到数字化的人物画像。
第三步,参数统计
对数字化后的每一项数据,进行统计
第四步,计算相似程度
这里用到的计算方法和词频统计一样,而拓展一些的地方是,可以给某些参数增加权重。
这样就可以结合你的个人状况,找到最适合你的对象了。
大数据
你应该已经注意到了,我们做文章自动分类的前提,是有足够多的文章数据
所以,用余弦定理+大数据找到心仪的对象,也需要有足够多的数字化数据。
而一切的前提,是要有足够多的对象数据,所以要先挖掘下数据吧。
Plan
我有个帮你找对象的计划,如果你有找对象的需求,可以提交到我的系统里面来哦~
项目地址
- 本文标题:用余弦定理+大数据找到心仪的对象
- 创建时间:2020-03-23 22:16:11
- 本文链接:https://render.076666.xyz/posts/4f5d.html
- 版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!