早教吧作业答案频道 -->数学-->
内积公式相识度计算文档d1:abcafbafh文档d2:ac查询q:aca索引项集合={abcdefgh}查询和文档根据索引项集合建立的向量空间模型可以表示如下二值向量:abcdefghabcdefgha
题目详情
内积公式【相识度计算】
文档 d1:a b c a f b a f h
文档 d2:a c
查询 q:a c a
索引项集合 = {a b c d e f g h}
查询和文档根据索引项集合建立的向量空间模型可以表示如下二值向量:
a b c d e f g h a b c d e f g h a b c d e f g h
d1=(1,1,1,0,0,1,0,1) d2=(1,0,1,0,0,0,0,0) q=(1,0,1,0,0,0,0,0)
n
求sim(d1,q)= ∑(W k,q*W k,j)
k=1
wk,q是查询q的第K个索引项权重,Wk,j是文档j的第k个索引项权重.
知道的人呢帮我解答下吧.
求求你们了.最好能写下步骤.
文档 d1:a b c a f b a f h
文档 d2:a c
查询 q:a c a
索引项集合 = {a b c d e f g h}
查询和文档根据索引项集合建立的向量空间模型可以表示如下二值向量:
a b c d e f g h a b c d e f g h a b c d e f g h
d1=(1,1,1,0,0,1,0,1) d2=(1,0,1,0,0,0,0,0) q=(1,0,1,0,0,0,0,0)
n
求sim(d1,q)= ∑(W k,q*W k,j)
k=1
wk,q是查询q的第K个索引项权重,Wk,j是文档j的第k个索引项权重.
知道的人呢帮我解答下吧.
求求你们了.最好能写下步骤.
▼优质解答
答案和解析
这种相似度貌似已经是极大简化的了.
直接拿文档向量和查询向量作内积即可.
sim(d1,q) = (1,1,1,0,0,1,0,1)(1,0,1,0,0,0,0,0) = 2.
sim(d2,q) = (1,0,1,0,0,0,0,0)(1,0,1,0,0,0,0,0) = 2.
实际上,文档d2明显更接近于查询q,但根据该相似度定义,d1和d2无法区分好坏.这说明这种简单的相似度度量基本没用.
正常的做法是计算TF-IDF的余弦相似度.如果你还不了解这个,可以上网搜搜.如果你已经掌握了,那就当我多嘴好了.:)
直接拿文档向量和查询向量作内积即可.
sim(d1,q) = (1,1,1,0,0,1,0,1)(1,0,1,0,0,0,0,0) = 2.
sim(d2,q) = (1,0,1,0,0,0,0,0)(1,0,1,0,0,0,0,0) = 2.
实际上,文档d2明显更接近于查询q,但根据该相似度定义,d1和d2无法区分好坏.这说明这种简单的相似度度量基本没用.
正常的做法是计算TF-IDF的余弦相似度.如果你还不了解这个,可以上网搜搜.如果你已经掌握了,那就当我多嘴好了.:)
看了 内积公式相识度计算文档d1:...的网友还看了以下:
下列说法正确的是()A、A点在C的正东方向B、A点在C的正西方向C、A点在C的东北方向D、A点在C 2020-05-13 …
如图所示,实线表示一簇关于x轴对称的等势面,在x轴上有A、B两点,则()A.A、B两点的场强方向与 2020-07-01 …
五个质点ABCDE,某时刻正好位于一个半径为R的圆上五个等分位置.他们一速率V运动,A指向C,B指 2020-07-06 …
指出下列各式中哪些是代数式,哪些不是①2>1②S=1/2(a+b)h③a④9⑤2x+1⑥5a>1/ 2020-07-29 …
lingo中根号和反三角函数怎样拼写比如v=L*(a/b*(h-b)*sqrt4(h*(2*b-h 2020-08-03 …
lingo中根号和反三角函数怎样拼写比如v=L*(a/b*(h-b)*sqrt4(h*(2*b-h 2020-08-03 …
补全对话(共5小题:每小题1分,满分5分)根据对话内容,从所给选项中选出能填人空白处的最佳选项。有多 2020-10-30 …
关于图的叙述,正确的是()A、山体的走向是东南-西北走向B、A、B两山顶之间的实地距离约为2千米C、 2020-12-15 …
某校平面图的一部分如图所示,则对点A、B的方位的说法基本正确的是()A.点A在点B的北偏西30°方向 2021-01-02 …
1关于单项式3ab的平方的系数是?次数是?2、已知梯形的面积公式是s=2分之一(a+b)h,(a,b 2021-01-14 …