Merge pull request #27 from ghost242/post/ai/rag

ghost242 · web-flow · commit bd112be8632f · 2025-10-06T23:48:20.000+09:00
Post/ai/rag
diff --git a/docs/ai/index.md b/docs/ai/index.md
@@ -0,0 +1,7 @@
+---
+layout: default
+title: AI
+has_children: true
+has_toc: true
+nav_order: 1
+---
diff --git a/docs/ai/rag/2025-10-05-introduce-knowledge_base.md b/docs/ai/rag/2025-10-05-introduce-knowledge_base.md
@@ -0,0 +1,153 @@
+---
+layout: post
+title: Prolog으로 살펴보는 지식 베이스의 구조
+subtitle: 관계를 중심으로 지식을 표현하는 방법
+parent: RAG
+grand_parent: AI
+comments: true
+categories: ["Programming", "RAG", "Knowledge Base"]
+tag: ["Knowledge Base", "Logic programming", "Prolog"]
+---
+
+## 지식 베이스란 무엇인가
+
+데이터베이스는 보통 “값(value)”을 저장하고 관리하기 위한 구조다.  하지만 현실의 많은 문제는 단순히 데이터를 개별적으로 다루는 것 보다, 데이터의 대상 간의 관계와 의미를 표현하는 것이 더 중요하다.
+
+예를 들어 “CPU는 메인보드의 일부이다”, “메인보드는 컴퓨터의 일부이다”라는 정보는 데이터라기보다 지식(knowledge) — 즉, 관계로 이루어진 사실이다.
+
+이렇게 사실(facts)과 관계(rules)를 체계적으로 표현해두고, 시스템이 그 관계를 기반으로 새로운 결론을 추론(inference) 할 수 있도록 만든 구조가 바로 `지식 베이스(Knowledge Base)`이다.
+
+## Prolog의 기본 문법 요약
+
+`Prolog`는 이런 지식 구조를 기술하기에 적합한 Logic programming 패러다임을 기반으로 하는 언어이다. 절차를 명령하는 대신, 무엇이 참인가를 선언하는 방식으로 동작한다. 이 글에서는 지식 구조를 표현하기위해 `Prolog`를 활용하고, 최대한 간단하게 문법 구조를 설명한다.
+
+`Prolog`의 핵심 구성 요소는 세 가지다:
+
+1. `사실(Fact)`: “A는 B의 일부이다.” 같은 참인 문장  
+
+2. `규칙(Rule)`: “A가 B의 일부이거나, B가 C의 일부이면 A는 C의 일부이다.” 같은 논리적 정의  
+
+3. `질의(Query)`: “CPU는 컴퓨터의 일부인가?” 같은 질문  
+
+예를 들어 문법은 다음처럼 간단하다.
+
+```prolog
+fact.                      % 사실
+rule :- condition.         % 규칙
+?- query.                  % 질의
+```
+
+이 구조를 통해 `Prolog`는 데이터가 아닌 논리적 관계를 저장하고 추론한다.
+
+## 예제: 컴퓨터 부품을 이용한 지식 베이스
+
+이재 지식 베이스를 이해하기 위해 예제로 컴퓨터의 구성 관계를 Prolog 문법을 활용해서 표현해보려고 한다.
+
+### 사실 정의
+
+먼저 각 부품이 어떤 구성 요소에 속하는지를 사실로 정의한다.
+
+```prolog
+% 상위 구조
+part_of(motherboard, computer).
+part_of(power_supply, computer).
+part_of(storage, computer).
+part_of(case, computer).
+part_of(peripheral, computer).
+
+% 메인보드 구성
+part_of(cpu, motherboard).
+part_of(memory, motherboard).
+part_of(gpu, motherboard).
+part_of(chipset, motherboard).
+
+% CPU 내부 구성
+part_of(core, cpu).
+part_of(cache, cpu).
+part_of(alu, cpu).
+part_of(control_unit, cpu).
+
+% 저장 장치 구성
+part_of(hard_disk, storage).
+part_of(ssd, storage).
+
+% 주변 장치 구성
+part_of(keyboard, peripheral).
+part_of(mouse, peripheral).
+part_of(monitor, peripheral).
+part_of(speaker, peripheral).
+```
+
+이것은 “CPU는 메인보드의 일부이다”, “메인보드는 컴퓨터의 일부이다”와 같은 기초 지식*이다.
+
+### 규칙 정의
+
+이제 이 관계를 바탕으로 더 넓은 의미의 포함 관계를 추론하는 규칙을 정의할 수 있다.
+
+```prolog
+is_part_of(X, Y) :- part_of(X, Y).
+is_part_of(X, Y) :- part_of(X, Z), is_part_of(Z, Y).
+```
+
+이 규칙은
+
+* X가 Y의 직접적인 부품이면 참이다.
+* X가 Z의 부품이고, Z가 Y의 일부라면, X도 Y의 일부로 본다.
+
+즉, 계층적인 관계를 재귀적으로 추론하도록 만든 것이다.
+
+### 질의 수행
+
+이제 시스템에 질문을 던져보자.
+
+```prolog
+?- is_part_of(cpu, computer).
+```
+
+Prolog는 다음과 같은 과정을 통해 결과를 찾아낸다.
+
+```plaintext
+alu → cpu → motherboard → computer
+```
+
+결과: `true.`
+
+또는 컴퓨터에 포함된 모든 부품을 물을 수도 있다.
+
+```prolog
+?- is_part_of(X, computer).
+```
+
+출력:
+
+```plaintext
+X = motherboard ;
+X = cpu ;
+X = memory ;
+X = gpu ;
+X = chipset ;
+X = core ;
+X = cache ;
+X = alu ;
+X = control_unit ;
+X = power_supply ;
+X = storage ;
+X = hard_disk ;
+X = ssd ;
+X = case ;
+X = peripheral ;
+X = keyboard ;
+X = mouse ;
+X = monitor ;
+X = speaker.
+```
+
+이 결과는 지식 베이스가 단순한 데이터 저장소가 아니라, 관계 정의만으로 논리적 전체 구조를 스스로 탐색하는 시스템임을 보여준다.
+
+## 결론
+
+이 간단한 예제는 지식 베이스의 핵심 구조를 이해하기 위해 작성했따. 지식 베이스는 데이터를 나열하는 것이 아니라, 데이터로 표현되는 사물 간의 관계를 정의하고 그 관계를 통해 새로운 사실(fact)을 추론하는 시스템이다.
+
+Prolog는 이러한 구조를 가장 단순하고 명확한 형태로 표현할 수 있게 해준다. 즉, “무엇을 할 것인가”가 아니라 “무엇이 참인가”를 선언하고, 그로부터 시스템이 스스로 답을 찾아내는 방식을 실험할 수 있는 언어다. 이 언어의 문법을 이용해 사실을 나열하고 규칙을 정의한 뒤 질의를 통해 지식을 인출하는 방식을 표현했다.
+
+이것이 지식 베이스의 본질이며, 오늘날의 인공지능이 다루는 지식 표현(knowledge representation)의 출발점이다.
diff --git a/docs/ai/rag/index.md b/docs/ai/rag/index.md
@@ -0,0 +1,8 @@
+---
+layout: default
+title: RAG
+parent: AI
+has_children: true
+has_toc: true
+nav_order: 1
+---
diff --git a/docs/graph_rag.md b/docs/graph_rag.md
@@ -0,0 +1,14 @@
+Graph와 Knowledge base에 대해서
+
+개요
+
+나는 지식을 머릿속에 막연히 나열하는것 보다는 대표 키워드를 중심으로 구조화 하고 키워드간의 관계를 구축하는 것이 기억에도 유리하고, 관련 지식을 다양하게 꺼내는데도 도움이 된다는 것을 감각적으로 느끼고 있었다. 하지만 LLM은 어떻게 하고있고, Graph로 구조화된 지식을 어떻게 다루게 하는지에 대해서는 최근에 알게 되었다. 이 문서는 그렇게 최근에 알게된, Knowledge base를 Graph로 구조화 하는것과 LLM과의 통합에 대해 간략하게 정리하는 것을 목표로 한다.
+
+Knowledge base
+
+대표 키워드로 정의되는 지식과, 지식들 간의 관계를 정의해야 한다는 것이 어떤 의미인지는 최근까지 이해하지 못하고 있었다. 알았다면 <프로그래밍 언어> 강의를 들을 때  `Prolog` 언어를 이해하는데 도움이 되었을 것이다. 당장 떠오르는 사례가 Prolog 이기 때문에, 간단하게 Prolog 문법으로 표현된 database를 이용해서 정리해보려고 한다.
+
+Prolog
+
+Logical Programming 이라는 언어 패러다임을 갖고있는 Prolog는 Procedure Language를 패러다임으로 갖고있는 언어들과는 구조가 너무 달라서 이해하기 어려웠으나, 코드가 순차실행되지 않는다는 사실만 받아들이면 된다. 이 특징은 현대에 연구되고있는 Functional language 패러다임 언어에서도 나타나는 특징이기 때문에 지금은 비교적 쉽게 샘플 코드를 얻을 수 있다.
+