早教吧作业答案频道 -->数学-->
内积公式相识度计算文档d1:abcafbafh文档d2:ac查询q:aca索引项集合={abcdefgh}查询和文档根据索引项集合建立的向量空间模型可以表示如下二值向量:abcdefghabcdefgha
题目详情
内积公式【相识度计算】
文档 d1:a b c a f b a f h
文档 d2:a c
查询 q:a c a
索引项集合 = {a b c d e f g h}
查询和文档根据索引项集合建立的向量空间模型可以表示如下二值向量:
a b c d e f g h a b c d e f g h a b c d e f g h
d1=(1,1,1,0,0,1,0,1) d2=(1,0,1,0,0,0,0,0) q=(1,0,1,0,0,0,0,0)
n
求sim(d1,q)= ∑(W k,q*W k,j)
k=1
wk,q是查询q的第K个索引项权重,Wk,j是文档j的第k个索引项权重.
知道的人呢帮我解答下吧.
求求你们了.最好能写下步骤.
文档 d1:a b c a f b a f h
文档 d2:a c
查询 q:a c a
索引项集合 = {a b c d e f g h}
查询和文档根据索引项集合建立的向量空间模型可以表示如下二值向量:
a b c d e f g h a b c d e f g h a b c d e f g h
d1=(1,1,1,0,0,1,0,1) d2=(1,0,1,0,0,0,0,0) q=(1,0,1,0,0,0,0,0)
n
求sim(d1,q)= ∑(W k,q*W k,j)
k=1
wk,q是查询q的第K个索引项权重,Wk,j是文档j的第k个索引项权重.
知道的人呢帮我解答下吧.
求求你们了.最好能写下步骤.
▼优质解答
答案和解析
这种相似度貌似已经是极大简化的了.
直接拿文档向量和查询向量作内积即可.
sim(d1,q) = (1,1,1,0,0,1,0,1)(1,0,1,0,0,0,0,0) = 2.
sim(d2,q) = (1,0,1,0,0,0,0,0)(1,0,1,0,0,0,0,0) = 2.
实际上,文档d2明显更接近于查询q,但根据该相似度定义,d1和d2无法区分好坏.这说明这种简单的相似度度量基本没用.
正常的做法是计算TF-IDF的余弦相似度.如果你还不了解这个,可以上网搜搜.如果你已经掌握了,那就当我多嘴好了.:)
直接拿文档向量和查询向量作内积即可.
sim(d1,q) = (1,1,1,0,0,1,0,1)(1,0,1,0,0,0,0,0) = 2.
sim(d2,q) = (1,0,1,0,0,0,0,0)(1,0,1,0,0,0,0,0) = 2.
实际上,文档d2明显更接近于查询q,但根据该相似度定义,d1和d2无法区分好坏.这说明这种简单的相似度度量基本没用.
正常的做法是计算TF-IDF的余弦相似度.如果你还不了解这个,可以上网搜搜.如果你已经掌握了,那就当我多嘴好了.:)
看了 内积公式相识度计算文档d1:...的网友还看了以下:
偶函数f(x)=ax2-2bx+1在(-∞,0]上递增,比较f(a-2)与f(b+1)的大小关系( 2020-05-20 …
已知偶函数f(x)=loga|x-b|在(-∞,0)上单调递增,则f(a+1)与f(b+2)的大小 2020-06-05 …
有四个人借钱的数目分别是这样的:A向B借了10美元;B向C借了20美元;C向D借了30美元;D又向 2020-06-30 …
五个质点ABCDE,某时刻正好位于一个半径为R的圆上五个等分位置.他们一速率V运动,A指向C,B指 2020-07-06 …
图,菱形纸片ABCD中,角A=60°,将纸片折叠,点A,D分别落在A'D'处,且A'D'经过BEF 2020-07-06 …
python组合问题有一个二维数列list=[['a','b'],['c','d','e'],'f 2020-07-17 …
设随机变量X的密度函数为f(x),且f(-x)=f(x),F(x)是X的分布函数,则对任意实数a, 2020-07-21 …
已知函数f(x)是R上的增函数,对实数a,b,若a+b>0,则有()A.f(a)+f(b)>f(- 2020-08-01 …
单选设函数f(x)可导,又y=f(-x),则y‘=(A.f‘(x)B.f‘(-x)C.-f‘(x)D 2020-11-03 …
丹霞地貌的形成过程正确的是()A.c→b→d→a→f→eB.b→a→c→d→f→eC.a→h→c→d 2020-11-21 …