Chapter17. Reasoning over Knowledge Graphs

What is knowledge Graph?

Graph์—์„œ Knowledge๋“ค์€ entities / types / relationships๋กœ ๋‚˜๋‰˜์–ด์ ธ ์žˆ์Œ. ๊ฐ node๋“ค์€ ๊ณ ์œ ์˜ entitles(์ด๋ฆ„ ๊ฐ™์€ ๊ฒƒ๋“ค)์ด ์žˆ์œผ๋ฉฐ ๊ทธ์— ๋Œ€ํ•œ type์ด ์ •ํ•ด์ ธ์žˆ์Œ. ๋˜ node๋“ค์€ Edge๋กœ relationship์„ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค.

ex) '๋ฐ•์ง„ํ˜'์ด๋ผ๋Š” node๋Š” '์‚ฌ๋žŒ'์ด๋ผ๋Š” type์œผ๋กœ labelling ๋˜์–ด ์žˆ์œผ๋ฉฐ, 'ํˆฌ๋น…์Šค'๋ผ๋Š” node(type์€ club)์— member๋ผ๋Š” relationship์„ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค. ์™€ ๊ฐ™์ด ํ‘œํ˜„์ด ๋˜๋Š” ๊ฒƒ์ด๋‹ค.

๊ทธ๋ž˜์„œ ์ด๊ฑธ QA๋ชจ๋ธ์—๋„ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. (QA๋ชจ๋ธ๋„ ๋ชจ๋ฅด๋Š”๋ฐ ์ด๊ฑธ ๋‚ด๊ฐ€ ํ•œ๋‹ค๋Š” ๊ฑด ๋ฌด์—‡์ธ๊ฐ€ ์ž˜๋ชป๋๋‹ค๋Š” ๊ฑธ ์ด์‹œ์ ์—์„œ ๋Š๊ผˆ๋”ฐ)

์ฆ‰ ์œ„ ๊ทธ๋ฆผ๊ณผ๊ฐ™์ด, ์ถ”์ˆ˜๊ฐ์‚ฌ์ ˆ, travel, NY๊ณผ ๊ฐ™์€ ํ‚ค์›Œ๋“œ๊ฐ€ ์žˆ์œผ๋ฉด, NY ์— ์†ํ•ด์žˆ๋Š” JFK ๊ณตํ•ญ, Thanks giving์— ํ•ด๋‹นํ•˜๋Š” ์—ฐ๊ด€ ๋…ธ๋“œ๋“ค์— ์ ‘๊ทผํ•ด answer๋ฅผ ์œ ๋„ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜๋Š” ๊ฒƒ์ด๋‹ค

๊ทธ๋Ÿฌ๋‚˜ knowledge graph๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋Š” ๋Œ€๋ถ€๋ถ„์˜ ๊ฒƒ๋“ค์€ (์œ„ํ‚คํ”ผ๋””์•„๋ฅผ ์ƒ๊ฐํ•ด๋ณด์ž)

  1. Massiveํ•˜๊ณ 

  2. Incomplete ํ•˜๋‹ค

-> ๊ทธ๋ ‡๋‹ค๋ฉด missing edge๋“ค์„ ๊ฝค ์ž˜ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์ด ์žˆ์„๊นŒ?

Embedding

Freebase๋ผ๋Š” ๊ณณ์— ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅด ๋ชจ๋ธ๋กœ ๋‘ฌ๋ณด์ž. KG์—์žˆ๋Š” edge๋Š” ํฌ๊ฒŒ ์„ธ ๊ฐ€์ง€ ์ƒํƒœ๋กœ ํ‘œํ˜„์ด ๋œ๋‹ค.

์‹œ์ž‘์ (head), ๋„์ฐฉ์ (tail), ๊ทธ๋ฆฌ๊ณ  ๊ทธ ๋…ธ๋“œ์˜ ๊ด€๊ณ„(relationship).

๊ทธ๋ž˜์„œ ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š” entitles์™€ realtion์„ ์•„์ฃผ ์ž˜ modelingํ•ด๋ณด์ž๋Š” ๊ฒƒ์ด๋‹ค. true (h,r,t)๊ฐ€ ์žˆ์„๋•Œ ์ด๋ฅผ ์ด์šฉํ•ด (h,r)์„ ์ž„๋ฒ ๋”ฉ ํ•ด๋ณด์ž๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ์ด๋‹ค.

๋‹ค๋งŒ ๊ทธ ์ „์— relation์˜ ๊ฒฝ์šฐ๋Š” ๋ช‡ ๊ฐ€์ง€ ํŠน์ˆ˜ํ•œ ๊ฒฝ์šฐ๋“ค์ด์žˆ๋‹ค.

  1. Symmetric Relation : A ์™€ B๋Š” symmetricํ•ด์•ผํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๋‹ค. ์–ด๋–ค ๊ฐ€์กฑ์˜ ๊ตฌ์„ฑ์›๋“ค์€ ์„œ๋กœ๊ฐ„์˜ ๊ด€๊ณ„๊ฐ€ ๊ฐ€์กฑ์ด๋ฉฐ, ์–ด๋–  ์ง‘๋‹จ์˜ ๋ฌด๋ฆฌ๊ฐ€ ์žˆ์œผ๋ฉด ๊ทธ ์ง‘๋‹จ ๋‚ด์—์„œ ๊ฐ ์‚ฌ๋žŒ๋“ค์˜ ๊ด€๊ณ„๋Š” friends์ผ๊ฒƒ์ด๋‹ค.

  2. Compostion Relation : ๋‚˜์™€ ์•„๋น ์˜ ๊ด€๊ณ„๋Š” ๋‚˜์™€ ์—„๋งˆ์˜ ๊ด€๊ณ„ + ์—„๋งˆ์™€ ๋‚จํŽธ์˜ ๊ด€๊ณ„์ด๋‹ค. ์ฆ‰, ๋‚˜๋ผ๋Š” ๋ฒกํ„ฐ์— ์—„๋งˆ๋ผ๋Š” ๋ฒกํ„ฐ์™€ ๋‚จํŽธ์ด๋ผ๋Š” ๋ฒกํ„ฐ๋ฅผ ํ•ฉ์น˜๋ฉด ์•„๋น ๋ผ๋Š” ๋ฒกํ„ฐ๊ฐ€ ๋‚˜์™€์•ผํ•œ๋‹ค.

  3. 1 - to -N, N-to-1 ํˆฌ๋น…์Šค๋ผ๋Š” entity์™€ ํˆฌ๋น…์Šค ๋ฉค๋ฒ„๋“ค์˜ entity์˜ ๊ด€๊ณ„๋Š” ๋ชจ๋“  ํˆฌ๋น…์Šค ๋ฉค๋ฒ„์— ๋Œ€ํ•ด member of๊ฐ€ ๋œ๋‹ค. ์ฆ‰, ํ•˜๋‚˜์˜ entity์— ํŠน์ •ํ•œ ๋ฒกํ„ฐ๋“ค๋ฅผ ์—ฐ์‚ฐํ•˜๋ฉด ์—ฌ๋Ÿฌ relationship์ด์ƒ๊ธธ ์ˆ˜ ์žˆ๋‹ค.

์‚ฌ์‹ค, Node์™€ Edge๋ฅผ embeddingํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ์•ž์—์„œ ํ•˜๋‚˜ ๋ฐฐ์› ๋‹ค.

Trans_E head + realationship = Tail์ด ๋‚˜์˜ค๊ฒŒ๋” embeddingํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ๋‹ค๋งŒ ์ด๋ ‡๊ฒŒ ๋˜๋ฉด ํฐ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค.

  1. Symmetric : h + r= t, t+r = h๋ฅผ ๋ชจ๋‘ ๋งŒ์กฑํ•ด์•ผํ•œ๋‹ค. ์ฆ‰ t - r = t + r, r= 0์ด ๋œ๋‹ค. ์ฆ‰ ๋Œ€์นญ์ ์ธ ๋ฒกํ„ฐ๋Š” ์กด์žฌํ•  ์ˆ˜ ์—†๊ฒŒ ๋œ๋‹ค.

  2. composition : ์ด๊ฒƒ์€ ์—„๋งˆ ๋ฒกํ„ฐ + ๋‚จํŽธ ๋ฒกํ„ฐ = ์•„๋น  ๋ฒกํ„ฐ ๊ฐ€ ๋‚˜์˜ค๊ฒŒ ํ•  ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ์„ฑ๋ฆฝํ•œ๋‹ค.

  3. 1 to N : ํˆฌ๋น…์Šค๋ผ๋Š” ๋ฒกํ„ฐ์— ๋ฉค๋ฒ„ ๋ฒกํ„ฐ๋ฅผ ๋”ํ•˜๋ฉด ํˆฌ๋น…์Šค ๋ฉค๋ฒ„๋“ค์ด ๋‚˜์™€์•ผํ•˜์ง€๋งŒ, ์ด๋ ‡๊ฒŒ ํ•˜๊ฒŒ ๋˜๋ฉด ๋ฉค๋ฒ„ ๋ฒกํ„ฐ๊ฐ€ ํ•˜๋‚˜๋ฐ–์— ๋‚˜์˜ค์ง€ ์•Š๋Š”๋‹ค.

=> ์œ„ ๋ฌธ์ œ๋“ค์„ ์ข…ํ•ฉํ•ด๋ณด๋ฉด Trans_E๋Š” ์ž„๋ฒ ๋”ฉํ•˜๊ธฐ์— ์ข‹์ง€ ๋ชปํ•œ ์ˆ˜๋‹จ์ด๋‹ค.

Trans_R

TransR์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๋ชจ๋ธ๋ง ํ•˜๋Š”๊ฒƒ์ด๋‹ค. relation์„ Matrix๋ฅผ ์ด์šฉํ•ด ๋งŒ๋“ค๊ณ , head vector์— Matrix๋ฅผ ๊ณฑํ•˜๋ฉด head projection (Vector space์˜ ํฌ๊ธฐ๋Š” ๊ฐ™๋‹ค)๊ณผ tail projection์ด ๋‚˜์˜จ๋‹ค. ๊ทธ๋ฆฌ๊ณ  relation์€

|hใ…— + r - tใ…— |๋กœ ์ •์˜ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

์ด์ œ ๋”ฐ์ ธ๋ณด์ž

  1. Symmetric : ํ‘œํ˜„๊ฐ€

2. 1 to N, N to 1 : ํ‘œํ˜„๊ฐ€

3. Composition Relation => ๋ถˆ๊ฐ€

์—ฌ๊ธฐ์„œ ์ฃผ์˜ํ•ด์•ผํ•  ์ ์€ Mr์€ ๋ชจ๋“  relation์— ๋Œ€ํ•ด ์กด์žฌํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.

Path Query

์ด ๋•Œ Query๋Š” ์ด 4๊ฐ€์ง€ ์ข…๋ฅ˜๊ฐ€ ์กด์žฌํ•˜๋Š”๋ฐ ๊ฐ๊ฐ ์–ด๋–ค ์—ญํ• ์„ ํ•˜๋Š” ์ง€ ์•Œ์•„๋ณด์ž

One-hop Queries๋Š” ๋‹จ์ˆœํ•˜๋‹ค A์™€ B์˜ ๊ด€๊ณ„๊ฐ€ r์ด๋ผ๋ฉด A๋ผ๋Š” ์‹œ์ž‘์ ๊ณผ r์ด๋ผ๋Š” ๊ด€๊ณ„๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ B๋กœ๋„๋‹ฌํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด๋‹ค.

์—ฌ๊ธฐ์„œ ์ƒˆ๋กœ๋‚˜์˜ค๋Š” ๊ฐœ๋…์€ Path ์ด๋‹ค. ์–ด๋–ค ์ด์–ด์ง€๋Š” ๊ฒƒ๋“ค์ด ์žˆ์„ ๋•Œ, ์ด๊ฒƒ๋“ค์€ ์–ด๋–ป๊ฒŒ ๊ณ„์‚ฐํ• ๊นŒ? ์ผ๋‹จ ์ •์˜๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋ฐฉ์‹์œผ๋กœ ํ‘œํ˜„ํ•œ๋‹ค. ์‹œ์ž‘์  Va์™€ relation์„ ๋‚˜ํƒ€๋‚ด๋Š” r๋ฒกํ„ฐ๋“ค์„ ํ†ตํ•ด ๋‚˜ํƒ€๋‚ธ๋‹ค.

๊ทธ๋ฆฌ๊ณ  ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๊ณ„์‚ฐ๋œ๋‹ค

๋จผ์ € r๋ฒกํ„ฐ๋ฅผ ํ†ตํ•ด ๊ทธ์— ํ•ด๋‹นํ•˜๋Š” Entity๋กœ ์ด๋™ํ•˜๊ณ  ๋˜ ๊ฑฐ๊ธฐ์„œ r2๋ฒกํ„ฐ๋ฅผ ํ†ตํ•ด ๋˜ ๊ทธ์— ํ•ด๋‹นํ•˜๋Š” ๋ฒกํ„ฐ๋กœ ์ด๋™ํ•œ๋‹ค. ์ฆ‰ ๋„์‹ํ™”ํ•˜๊ฒŒ๋˜๋ฉด

์™€ ๊ฐ™์ด ํ‘œํ˜„์ด ๋˜๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ์‹ค์ œ KG๋Š” ๋งค์šฐ๋งค์šฐ ๋งŽ์€ node๋“ค๊ณผ ์—ฐ๊ฒฐ์ด ๋˜์–ด์žˆ๋‹ค. ์ฆ‰ Path๊ฐ€ ๊ธธ์–ด์ง€๋ฉด ๊ธธ์–ด์งˆ์ˆ˜๋ก Geometricํ•˜๊ฒŒ ๊ฒฝ๋กœ๊ฐ€ ๊ธธ์–ด์ง€๊ฒŒ ๋˜๋Š” ๊ฒƒ์ด๋‹ค.

๊ทธ๋ ‡๊ธฐ ๋•Œ๋ฌธ์— ์šฐ๋ฆฌ๋Š” transE๋ฅผ ์ด์šฉํ•ด Path๋ฅผ ํ•œ๋ฒˆ์— ์ž„๋ฒ ๋”ฉํ•  ๊ฒƒ์ด๋‹ค.

์ฆ‰ ์ด๋Ÿฐ ์‹์œผ๋กœ ์—ฌ๋Ÿฌ ๋ฒกํ„ฐ๋ฅผ ํ•œ ๋ฒˆ์— ์ด๋™ํ•จ์œผ๋กœ์จ ์—ฐ์‚ฐ์„ ์ค„์ผ ์ˆ˜ ์žˆ๋‹ค.์ฆ‰ ๋ˆ„๋‚˜์˜ ์นœ๊ตฌ๋“ค์ด๋ผ๊ณ  ํ•˜๋ฉด ๋ˆ„๋‚˜ ๋ผ๋Š” ๊ด€๊ณ„๋ฅผ ๋ชจ๋‘ ์ฐพ์•„์„œ ์ด๋™ํ•œ ๋’ค, ๊ฑฐ๊ธฐ์„œ ์นœ๊ตฌ๋ฒกํ„ฐ๋“ค์„ ๋‹ค์‹œ ๋‹ค ์ฐพ์•„๊ฐ€๋Š” ๊ฒƒ๋ณด๋‹ค๋Š” ๋ˆ„๋‚˜ + ์นœ๊ตฌ ๋ฒกํ„ฐ๋ฅผ ํ•ด์„œ ํ•œ ๋ฒˆ์— ๋„๋‹ฌํ•˜๊ฒŒํ•˜๋Š” ๊ฒƒ์ด ํšจ์œจ์ ์ด๋ผ๋Š” ๊ฒƒ์ด๋‹ค. (๊ทธ๋Ÿฐ๋ฐ, ์ด๋Ÿฌ๋ฉด ์นœ๊ตฌ์•„๋น ๋ž‘ ์•„๋น ์นœ๊ตฌ๋ž‘ ๊ตฌ๋ถ„์ด ์•ˆ๋˜์ง€์•Š๋‚˜..?)

๋˜ ๊ด€๋ จ ๋…ผ๋ฌธ์„ ์ฐพ์•„๋ณด๋ฉด

์ด๋Ÿฌํ•œ ๋‚ด์šฉ๋„ ์ฐพ์•„๋ณผ ์ˆ˜ ์žˆ๋Š”๋ฐ, ๋งŒ์•ฝ ์•„๋น  ๋ผ๋Š” ๋ฒกํ„ฐ๊ฐ€ ์ˆ˜ํ‰์ด๋ผ๊ณ  ํ•˜๋ฉด ๋‚˜์˜ ์•„๋น ๋กœ ์ด๋™ํ•˜๋Š”๋ฐ ๋…ธ์ด์ฆˆ๊ฐ€ ์•ฝ๊ฐ„ ๋‚€๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ์•„๋น ์˜ ์•„๋น  ๋ฒกํ„ฐ์ธ ํ• ์•„๋ฒ„์ง€ ๋ฒกํ„ฐ๊ฐ€ ๊ฐ€๊ฒŒ๋˜๋ฉด ์ด ์—๋Ÿฌ๊ฐ€ ๊ฐˆ์ˆ˜๋ก ์ปค์ง€๊ฒŒ ๋˜๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋Ÿฌํ•œ ๊ด€์ ์—์„œ๋„, ์‹œ์ž‘์  + relation ๋ฒกํ„ฐ๋“ค์„ ๋”ํ•ด์„œ ๋‚˜์˜จ q๋ฒกํ„ฐ์™€ ์‹ค์ œ ๋„์ฐฉํ•ด์•ผํ•˜๋Š” ์ ์ธ v๋ฒกํ„ฐ๋ฅผ ํ†ตํ•ด ๊ณ„์‚ฐํ•˜๋Š” ๊ฒƒ์€ ๋ถ„๋ช… ์ด์ ์ด ์กด์žฌํ•œ๋‹ค.

Conjunctive Queries(๋…ผ๋ฆฌ๊ณฑ~)

Conjunctive๋ผ๋Š” ๋ง์€ ์‰ฝ๊ฒŒ ๋งํ•ด์„œ And๋ผ๊ณ  ์ƒ๊ฐํ•˜๋ฉด ๋œ๋‹ค. ์ฆ‰ Canadian์ด๋ฉด์„œ Turning award ์ˆ˜์ƒ์ž๋Š”..? ์„ ์ฐพ์„ ๋•Œ ์–ด๋–ป๊ฒŒ ์ฐพ์•„์•ผํ• ๊นŒ?

์ด๋Ÿฐ์‹์œผ๋กœ Canadian + Citizen์„ ๋จผ์ € ๊ตฌํ•˜๊ณ  Turing Award + win์„ ๊ตฌํ•ด์„œ ๋‘ intersection(๊ต์ฐจ๋ถ€๋ถ„..?)์„ ๊ตฌํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ์‚ฌ์‹ค ์ง๊ด€์ ์ธ Projection์€ ์ด๋Ÿฌํ•œ๋ฐ ์ €๋ ‡๊ฒŒ ๋ฒกํ„ฐ๊ฐ€ ๋”ฒ๋”ฒ ๋งž๊ฒŒ ๋–จ์–ด์งˆ๊นŒ?

ํ˜„์‹ค์€ ์ด๋ ‡๋‹ค.. ๋‘ ๋ถ€๋ถ„์˜ q1๊ณผ q2์˜ ๊ต์ ์„ ์ฐพ์•„์•ผํ•˜๋Š”๋ฐ ํ˜„์‹ค์ ์œผ๋กœ ๊ต์ ์ด ์ƒ๊ธธ๋ฆฌ๊ฐ€ ์—†๋‹ค. ๊ทธ๋ ‡๊ธฐ๋•Œ๋ฌธ์— ๊ทธ ๋‘๋ถ€๋ถ„์ด ๊ต์ฐจํ•˜๋Š” ์  ๊ตฌํ•ด์•ผํ•  ๊ฒƒ์ด๋‹ค. ์œ„ ๊ทธ๋ฆผ๋งŒ ๋ณด๋ฉด ์šฐ๋ฆฌ๋Š” ํžŒํ†ค๊ณผ ๋ฒค์ง€์˜ค๊ฐ€ ์‚ฌ์ด์–ด๋”˜๊ฐ€๋ฅผ ๊ต์ ์ด๋ผ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ์ด๋Ÿฐ ์ง๊ด€์ ์ธ ๊ฒฝ์šฐ๊ฐ€ ์•„๋‹ˆ๋ผ๋ฉด InterSection์„ ๊ตฌํ•˜๋Š” ๊ฒƒ์€ ํฐ ๋ฌธ์ œ๊ฐ€ ๋˜๋Š” ๊ฒƒ์ด๋‹ค.

์š”์ฆ˜ ์šฐ๋ฆฌ๋Š”, ๋”ฅ๋Ÿฌ๋‹์˜ ์‹œ๋Œ€์— ์‚ด๊ณ ์žˆ๋‹ค. ๋ชจ๋ฅด๊ฒ ์œผ๋ฉด Neural Network๋ฅผ ๋„์ž…ํ•˜์ž. ํ˜„์žฌ query๋“ค์„ input์œผ๋กœ ๋†“๊ณ  output์„ intersection point ๋‚˜์˜ค๊ฒŒ NN์„ ๋งŒ๋“ค์–ด๋ณด์ž.

๋‹ค์Œ๊ณผ ๊ฐ™์ด, ๊ฐ ๋ฒกํ„ฐ๋“ค์„ ๋„ฃ๋Š”๋ฐ permutation invariantํ•˜๋‹ค.. ์บ๋‚˜๋‹ค์ธ์ธ ์šฐ์Šน์ž๋‚˜, ์šฐ์Šน์ž์ธ ์บ๋‚˜๋‹ค์ธ์ด๋‚˜ ๊ฐ™์œผ๋‹ˆ ์ง๊ด€์ ์œผ๋กœ๋„ ๋‹น์—ฐํ•˜๋‹ค.

๋‹ค์Œ๊ณผ ๊ฐ™์ด, ๋ชจ๋“  ๋ฒกํ„ฐ๋ฅผ ๋„ฃ๊ณ  Neural Network๋ฅผ ํ†ต๊ณผํ•˜๊ณ  ์ „์ฒด๋ฅผ Meanํ•œ๋‹ค. ์•ž์— GCNํ•  ๋–„๋„ ์—ฐ๊ฒฐ๋œ ๋ชจ๋“  ๋…ธ๋“œ๋“ค์˜ ํ‰๊ท ์„ ๋‚ด๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๊ทธ๋ž˜ํ”„์—์„œ๋Š” ํ‰๊ท ์„ ๋‚ด๋Š”๊ฒŒ ์•„์ฃผ ์ž์œ ๋กญ๋‹ค. ๊ทธ ์ดํ›„ ๋‹ค์‹œ ๋„คํŠธ์›Œํฌ๋ฅผ ํ†ต๊ณผ์‹œ์ผœ intersction์„ ์–ป์„ ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค.

๋‹ค์Œ๊ณผ ๊ฐ™์ด ๊ตฌํ•ด์ง€๋Š” ๊ฒƒ์ด๋‹ค. q1๊ณผ q2์˜ intersection์„ ๊ตฌํ•˜๊ณ  ๊ทธ ๋ฒกํ„ฐ์— graduate ๋ฒกํ„ฐ๋ฅผ ๊ตฌํ•ด ๊ทธ ์ด์›ƒ๋“ค์„ answer๋กœ ๊ตฌํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

์—ฌ๊ธฐ์„œ ํŒŒ์ด๋‚˜ ๋ฒ ํƒ€๋Š” graph size์— ์˜ํ–ฅ์„ ๋ฐ›์ง€ ์•Š๋Š” ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ ํŠธ๋ ˆ์ด๋‹ ํ•  ์ˆ˜ ์žˆ๋‹ค.

Box Query

์œ„์—์„œ intersection์˜ ์˜์—ญ์„ ๊ตฌํ•  ๋•Œ (ํŠน์ • ๋ฒกํ„ฐ์—์„œ ๊ฐ€๊นŒ์šด ๊ฒƒ๋“ค์„ ๊ตฌํ•  ๋•Œ) ์‚ฌ๋žŒ์ด ์กฐ์ •ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ง๊ด€์ ์ด์ง€ ์•Š๋‹ค๋Š” ์ ์ด ์žˆ๋‹ค. ๊ทธ๋ž˜์„œ ์šฐ๋ฆฌ๋Š” ์ƒˆ๋กœ์šด Box query๋ผ๋Š” ๊ฒƒ์„ ๋„์ž…ํ•œ๋‹ค.

Box Embeddings : queries๋ฅผ hyper rectangle๋กœ emneddingํ•˜๋Š” ๊ฒƒ

๋‹ค์Œ๊ณผ๊ฐ™์ด Center์™€ offset์œผ๋กœ ์ •์˜ํ•  ์ˆ˜ ์žˆ๋‹ค.์—ฌ๊ธฐ์„œ offset์€ q์™€ ๊ฐ™์€ dimension์ธ๋ฐ ๊ฐ dimension๋ณ„๋กœ ์–ด๋Š์ •๋„์˜ offset์„ ๊ฐ€์งˆ์ง€ ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

์ด ๋•Œ parameter๋“ค์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€๋ฐ ์˜๋ฏธ๋ฅผ ์ž˜ ์‚ดํŽด๋ณด.

entity embedding์€ d์˜ dimension์ด๊ณ  ๊ณต๊ฐ„์ƒ์—์„œ ํ•œ ์ ์„ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฒƒ์ด๋‹ค. ๊ณต๊ฐ„์ƒ์˜ ํ•œ ์ ์€ ๊ฒฐ๊ตญ offset์ด 0์ด๊ณ  Center๊ฐ€ entity embedding์„ ๋‚˜ํƒ€๋‚ธ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค. relation embedding์€ ์•ž์— 2๊ฐ€ ๋ถ™๋Š”๋ฐ ์ € ์œ„์—์„œ ์ •์˜ํ–ˆ๋“ฏ, Center์™€ Offset์ด ๋ชจ๋‘ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

๋˜ํ•œ Geometricํ•œ ์—ฐ์‚ฐ์œผ๋กœ Box X Relation = Box๋ผ๋Š” ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ค๋Š”๋ฐ, ์‚ฌ์‹ค ์™œ X๋ผ๋Š” ์—ฐ์‚ฐ์„ ์ผ๋Š” ์ง€๋Š” ์ž˜ ๋ชจ๋ฅด๊ฒ ์ง€๋งŒ, ์–ด๋–ค ๋‘ ์ ์„ ๋”ํ•  ๋•Œ๋Š”, Center๋ผ๋ฆฌ ๋”ํ•ด์„œ ์ƒˆ๋กœ์šด Center๋ฅผ ๋งŒ๋“ค๊ณ  offset๋ผ๋ฆฌ ๋”ํ•ด์„œ ์ƒˆ๋กœ์šด offset์„ ๋งŒ๋“ค๊ฒŒ ๋œ๋‹ค. (๋งŒ์•ฝ, entity๋ผ๋ฉด ๊ฐ™์€ offset์„ ๊ฐ€์ง€๊ณ  ์ค‘์‹ฌ๋งŒ ์ด๋™ํ•  ๊ฒƒ์ด๋‹ค) ์ด๋ ‡๊ฒŒ ๋˜๋ฉด ๊ฒฐ๊ตญ ์ „์ฒด ๋ฐ•์Šค์˜ ํฌ๊ธฐ๋Š” ๊ฐˆ์ˆ˜๋ก ์ปค์ง€๊ฒŒ ๋  ๊ฒƒ์ด๋‹ค.

๊ทธ๋ ‡๋‹ค๋ฉด Box X Box์˜ Operation์€ ์–ด๋–ป๊ฒŒ๋ ๊นŒ?

๋‹ค์Œ๊ณผ ๊ฐ™์€ ์‹์œผ๋กœ ์ฐพ๊ฒŒ ๋œ๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ๊ทธ๋ฆผ์—์„œ๋Š” ๊ทธ๋ƒฅ ๋‹ค ๊ฒน์น˜๋Š” ๋ถ€๋ถ„๋งŒ์„ ์ฐพ์•˜์ง€๋งŒ, ์ƒˆ๋กœ์šด ๋ฒกํ„ฐ๋Š” ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ์ •์˜๋œ๋‹ค.

์ผ๋‹จ ์ƒˆ๋กœ์šด Center๋Š” ๊ธฐ์กด box๋“ค์— weighted sum์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋Ÿฌํ•œ weight๋Š” ํ•™์Šต๋˜๋Š” ๊ฒƒ์ด๋ผ๊ณ  ์ƒ๊ฐํ•˜๋ฉด ๋œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  offset์˜๊ฒฝ์šฐ ์ผ๋‹จ mean ๊ฐ’์„ ์ทจํ•˜๊ธฐ ๋•Œ๋ฌธ์—, intersection์ด ์ƒ๊ธฐ๋ฉด offset์ด ์ค„์–ด๋“ ๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ์ € deepsets์€ ์กฐ๊ต๋‹˜ ๋ง์„ ์•Œ์•„๋“ฃ๊ธฐ๊ฐ€ ํž˜๋“ค์–ด..(์‚ฌ์‹ค count๋ผ๊ณ ๋Š” ํ•˜๋Š”๋ฐ count๊ฐ€ ์ง„์งœ ๋‚ด๊ฐ€ ์ดํ•ดํ•œ ๊ฒƒ์ด ๋งž๋Š”์ง€๋„ ๋ชจ๋ฅด๊ฒ ์–ด์„œ ํ•ด๋‹น ๋…ผ๋ฌธ์„ ์ฝ์–ด๋ณด์•˜๋‹ค.)

ํ•ด๋‹น ๋…ผ๋ฌธ์—์„œ๋Š” ๊ฐ ๋ฒกํ„ฐ๋ฅผ Mlp์— ๋„ฃ๊ณ  ํ‰๊ท ๋‚ธ ๊ฒƒ์„ ๋‹ค์‹œ MLP์— ๋„ฃ๋Š”๋‹ค. ์•„๋งˆ input์€ d (๋ฒกํ„ฐ ์ŠคํŽ˜์ด์Šค์˜ ์ฐจ์›)์„ ๋ชจ๋“  Set์— ๋Œ€ํ•ด mlp์— ๋„ฃ๊ณ  ๊ทธ mlp์˜ output์€ d dimension์ด ๋  ๊ฒƒ์ด๋‹ค. ๊ทธ๊ฒƒ ๋‹ค์‹œ ๋„ฃ์–ด์„œ (dXN) ์ฐจ์›์„ returnํ•˜๋Š” ๊ฒƒ ๊ฐ™๋‹ค.

๊ฒฐ๊ตญ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ง๊ด€ํ™”๋œ๋‹ค.

๊ทธ๋ฆฌ๊ณ  ์ด ์›๋ž˜ True node์™€ box์˜ ๊ฑฐ๋ฆฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋œ๋‹ค.

๋กœ์Šค๋Š” TransE์™€ ๋น„์Šทํ•˜๊ฒŒ ์ •์˜๋œ๋‹ค.

๋ฐ•์Šค์•ˆ์— ์žˆ์–ด์•ผํ•  ๊ฒƒ๋“ค์€ ๊ฑฐ๋ฆฌ๋ฅผ ์ตœ๋Œ€ํ•œ ์ค„์ด๊ณ , ๋ฐ•์Šค๋ฐ–์— ์žˆ์–ด์•ผํ•  ๊ฒƒ์€ ๊ฑฐ๋ฆฌ๋ฅด ์ตœ๋Œ€ํ™” ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ํŠธ๋ ˆ์ด๋‹ํ•ด์•ผํ•œ๋‹ค.

์ด๋ ‡๊ฒŒ query๋ฅผ ๋ฐ•์Šค๋กœ ์ž„๋ฒ ๋”ฉํ•˜๋ฉด ์œ„์—์„œ ๋งŒ์กฑํ•ด์•ผํ–ˆ๋˜, symmetric composition 1toN์ด ๋ชจ๋‘ ๋งŒ์กฑ๋œ๋‹ค.

๊ฐ•์˜์—์„œ๋Š” ์„ค๋ช…ํ•˜์ง€๋Š” ์•Š์•˜์ง€๋งŒ symmetric์ด ์•ฝ๊ฐ„ ๋น„์ง๊ด€์ ์ด์—ฌ ์‚ด์ง ์งš๊ณ  ๋„˜์–ด๊ฐ€์ž

symmetric์˜ ๊ฒฝ์šฐ Cen(r)์„ 0์œผ๋กœ ํ•˜๋ฉด ๋œ๋‹ค. ์ฆ‰, head์™€ tail์˜ ๊ฒฝ์šฐ ๋‚˜๋ผ๋Š” entity๊ฐ€ ์žˆ๊ณ , ๊ฑฐ๊ธฐ์— Offset๋งŒ ๋”ํ•˜๋ฉด ๊ทธ offset ๋ฒ”์œ„๋‚ด์— ์—„๋งˆ๊ฐ€ ์žˆ์œผ๋ฉด ๋˜๊ณ , ์—„๋งˆ entity์—์„œ offset์„ ๊ตฌํ•˜๋ฉด ๋˜ ๊ทธ ๋ฒ”์œ„์— ๋‚ด๊ฐ€ ์žˆ์„ ๊ฒƒ์ด๋‹ค. ๋”ฐ๋ผ์„œ symmetric์˜ ๊ฒฝ์šฐ Cen(r)์ด 0๊ฐ€๋ผ์•ผํ•œ๋‹ค.

Composition๊ณผ 1toN์˜ ๊ฒฝ์šฐ๋Š” ์ž๋ช…ํ•˜๋‹ค.

*EPFO query? : Conjunctive + disjunction query => and + or query! ์บ๋‚˜๋‹ค์ธ์ด๋ฉด์„œ turing์ด๋‚˜ ๋…ธ๋ฒจ์ƒ๋ฐ›์€ ์กธ์—…์ƒ? ๊ณผ ๊ฐ™์ด and์™€ or์ด ๋ชจ๋‘ ๋“ค์–ด๊ฐ„ ์ฟผ๋ฆฌ์˜ ๊ฒฝ์šฐ์—๋„ box๋ฅผ ์ด์šฉํ•ด์„œ ์ž˜ ์ž„๋ฒ ๋”ฉํ•  ์ˆ˜ ์žˆ๊ณ  ํ•œ๋‹ค.

Experiment

์‹คํ—˜๋ถ€๋ถ„์€ ๊ฒฐ๊ณผ๊ฐ€ ๋งŽ์•„์„œ ํ”ผํ”ผํ‹ฐ๋กœ~

Last updated