연구개발특구 규정 검색 AI 서비스
RAG 챗봇
Client:
연구개발특구진흥재단
Scope:
디자인, 기획, 개발
Year:
2025
문제점:
• 문서의 방대함과 복잡성, 다양한 데이터 형식(이미지·표·비정형 데이터), 그리고 잦은 개정으로 인해 필요한 정보를 신속하게 찾기 어려움
• 이로 인해 정보 검색에 많은 시간이 소모되고 업무 효율성이 저하됨
작업 목표:
• 국가연구개발혁신법, 연구 성과의 활용 및 확산, 연구자 및 기관의 역할 등 다양한 규정과 매뉴얼을 학습함으로써 임직원의 업무 효율성과 편의성 향상을 위한 규정 검색 LLM 챗봇 구축
1) 포트폴리오 소개
- 연구개발특구 내부 규정집, 국가연구개발혁신법, 각종 매뉴얼 등 공공기관 내부 규정 문서를 통합 검색
- BGE-M3 기반 임베딩 모델 + PineconeDB 벡터 데이터베이스 + Azure OpenAI GPT 모델을 활용한 RAG 검색 구조
- 질의응답 시 관련 문서 출처·원문까지 제공하여 신뢰성과 근거 확보
2) 작업 범위
[프론트엔드]
React + TypeScript 기반 SPA 개발
카테고리 선택형 검색 UI, Q&A 대화형 인터페이스, 즐겨찾기 질문 목록 구현
[백엔드]
Python 기반 REST API 서버 개발
BGE-M3 임베딩 모델 적용
PineconeDB 기반 벡터 검색 인덱스 구축
Azure OpenAI GPT 모델 연동
문서 전처리(Segmentation, OCR, 표 변환) 및 메타데이터 생성
관리자 페이지에서 문서 업로드 시 자동 전처리·인덱싱·DB 반영 기능
[인프라]
Docker 컨테이너 기반 서비스 패키징
Azure 클라우드 환경 배포 및 운영
LLMOps 기반 로그 수집·모니터링·성능 분석 구조 적용
3) 주요 업무
- 데이터 수집·정제: 규정집·매뉴얼·법령 문서 수집, 표/이미지 포함 비정형 데이터 처리
- 데이터 임베딩 및 인덱싱: BGE-M3 임베딩 모델 적용, PineconeDB 인덱스 구축
- RAG 검색 로직 개발: 사용자의 질의를 의미적으로 검색, GPT 응답과 함께 근거 문서 제공
- UI/UX 개발: 카테고리별 문서 선택, 질의응답 인터페이스, 즐겨찾는 질문 기능 구현
- 관리자 기능: 문서 자동 업데이트, 메타데이터 관리, 로그 기반 인기 질문 통계
- 성능 검증: LLM 기반 Critique Agent로 질문·응답 정확도 평가(Faithfulness, Relevance 등)
- 배포·운영: Docker 기반 Azure 배포, 모니터링·로그 분석을 통한 서비스 품질 개선


