목록Computer Science/AI (3)
091
(4) Function Calling&Tool Use: LLM은 기본적으로 텍스트만 생성합니다. 실시간 정보도 모르고, 계산도 틀리고 외부 시스템과 연동도 못합니다. Function Calling이 있으면 LLM이 날씨, 계산 등의 상황을 스스로 판단해 필요한 함수를 호출하는 게 핵심입니다.-> JSON Schema는 LLM에게 기능을 설명하는 방식으로, 말그대로 사용 가능한 기능을 알려줄 때 JSON 형식으로 전달합니다. 이때 description 부분을 보고 LLM이 해당 기능을 써야할지말지를 판단하기 때문에 설명부분을 제대로 작성해야합니다.-> 함수 호출이 언제나 성공하는 것이 아니기 때문에 에러 핸들링을 통해 LLM에게 에러를 알려줘 스스로 수정해서 재시도를 합니다. 그리고 에이전트가 같은 함수를..
2. LLM 보안 기술 - GPT 같은 LLM이 등장했지만, LLM 단독으로는 실제 서비스에서 최신 정보를 모르거나, 계산 실수, 할루시네이션(환각), 회사 내부 문서를 알지 못하는 등의 다양한 부족한 점이 있었습니다. 이러한 부족한 점을 메우기 위해서 프롬프트 엔지니어링, 파인튜닝, RAG, Function Calling, LangChain/LangGraph와 같은 기술이 나왔습니다. 이 글에서는 이 5개의 기술에 대해 간단하게 설명만 하고 넘어가며 이후 글에서 더 자세하게 다룰 예정입니다. (1) 프롬프트 엔지니어링(Prompt Engineering): LLM에게 말을 잘 거는 기술로, LLM에게 입력하는 텍스트인 프롬프트를 어떻게 쓰느냐에 따라 결과물의 품질이 완전히 달라집니다.-> Zero-sho..
1. LLM- LLM(Large Language Models)은 대량의 텍스트 데이터를 학습하여 인간처럼 언어를 이해하고 생성하는 AI 모델로, OpenAI의 GPT 계열, Google의 Gemini, Meta의 Llama 등이 있습니다.-> LLM의 가장 큰 특징인 Transformer Architecture는 RNN/LSTM의 방식의 한계를 극복한 구조입니다.• RNN(Recurrent Neural Network)는 예전 자연어 AI 구조로, 한 글자/한 단어씩 순서대로 문자을 읽었습니다. 이전 정보를 기억하면서 다음 단어를 처리하다보니 긴 문장은 기억을 잘 못하고 속도가 느리다는 단점이 있었습니다.• LSTM(Long Short-Term Memory)는 RNN을 개선한 구조로, 중요한 정보를 오래 ..
