목록으로

Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 7 - Agentic LLMs

Stanford Online AI 요약 생성: January 24, 2026

핵심 요약

LLM이 외부 시스템과 상호작용하는 방법을 다룹니다. RAG(Retrieval-Augmented Generation)를 통한 외부 지식 접근, Tool/Function Calling을 통한 구조화된 데이터 활용, 그리고 Agent를 통한 자율적 작업 수행 방식을 학습합니다.

주요 개념

RAG (Retrieval-Augmented Generation) 06:37

  • LLM의 knowledge cutoff 문제 해결
  • 모델 재학습 없이 최신 정보 접근 가능
  • 세 단계: Retrieve(검색) → Augment(증강) → Generate(생성)

Knowledge Base 구축 16:28

  • Chunking: 문서를 수백 토큰 단위로 분할 (보통 ~500 토큰)
  • Embedding: 각 청크를 벡터로 변환 (보통 ~1,500차원)
  • Overlap: 청크 간 중첩으로 문맥 유지

Two-Stage Retrieval 24:28

  • Candidate Retrieval: Bi-encoder로 빠르게 후보 필터링, Recall 최대화
  • Reranking: Cross-encoder로 정밀하게 순위 재조정, Precision 최적화
  • Semantic similarity (cosine) + BM25 (keyword matching) 하이브리드 가능

Contextual Retrieval 42:33

  • 청크에 문맥 정보를 prepend하여 이해도 향상
  • LLM 호출로 문맥 생성, Prompt Caching으로 비용 절감

Tool Calling / Function Calling 59:30

  • 구조화된 데이터를 함수로 표현하여 LLM이 활용
  • LLM은 함수 구현 아닌 API 시그니처와 문서만 참조
  • 3단계: 함수 선택 → 실행 → 결과를 자연어로 변환

Tool Calling 학습 방법 69:20

  • SFT 방식: 입출력 쌍으로 학습 (tool prediction + response generation)
  • Prompting 방식: 최신 모델은 few-shot/reasoning으로도 가능

MCP (Model Context Protocol) 77:00

  • Anthropic이 제안한 LLM-도구 연결 표준
  • Host(LLM), Client(connector), Server(tool provider) 구조
  • 도구 정의 표준화로 재사용성 향상

Agents 92:11

  • Tool calling의 상위 개념: 자율적으로 목표 추구
  • ReAct 패턴: Observe → Plan → Act 반복 루프
  • 목표 달성까지 다중 도구 호출 및 추론 수행

Multi-Agent & A2A Protocol 99:00

  • 복수 에이전트 간 협업 가능
  • Google의 Agent-to-Agent Protocol: skills, execute, cancel 표준화

Safety 고려사항 103:30

  • Data exfiltration 등 새로운 위험 발생
  • Training 단계 (harmlessness) + Inference 단계 (safety classifier) 대응
  • AgentSafetyBench로 안전성 평가

핵심 인사이트

  • RAG는 모델 재학습 없이 최신 정보 접근하는 실용적 방법
  • Retrieval 품질이 RAG 성능의 핵심 (Candidate Retrieval + Reranking)
  • Tool Calling으로 LLM이 외부 API/시스템과 상호작용 가능
  • Agent는 Tool + Reasoning Loop로 복잡한 작업 자율 수행
  • 강력한 능력에는 Safety 대책이 필수 (학습/추론 양면)