정의 #
LLM은 문서 내용을 직접 읽거나 해석할 수 없습니다. 따라서 문서 추출 노드를 통해 사용자가 업로드한 문서의 정보를 구문 분석하고 읽어서 텍스트로 변환한 후, LLM에 전달하여 파일 내용을 처리해야 합니다.
응용 프로그램 시나리오 #
- ChatPDF나 ChatWord와 같이 파일과 상호 작용할 수 있는 LLM 애플리케이션을 구축합니다.
- 사용자가 업로드한 파일의 내용을 분석하고 조사합니다.
노드 기능 #
문서 추출 노드는 정보 처리 센터로 이해될 수 있습니다. 입력 변수의 파일을 인식하고 읽고, 정보를 추출하여 다운스트림 노드가 호출할 수 있도록 문자열 유형의 출력 변수로 변환합니다.문서 추출기 노드 구조는 입력 변수와 출력 변수로 구분됩니다.입력 변수문서 추출기는 다음과 같은 데이터 구조를 가진 변수만 허용합니다.
File
, 단일 파일Array[File]
, 여러 파일
문서 추출기는 TXT, 마크다운, PDF, HTML, DOCX 형식 파일의 내용과 같은 문서 유형 파일에서만 정보를 추출할 수 있습니다. 이미지, 오디오, 비디오 또는 기타 파일 형식은 처리할 수 없습니다.출력 변수출력 변수는 고정되어 있으며 텍스트라는 이름이 지정됩니다. 출력 변수의 유형은 입력 변수에 따라 달라집니다.
- 입력 변수가 이면
File
출력 변수는string
- 입력 변수가 이면
Array[File]
출력 변수는array[string]
배열 변수는 일반적으로 목록 연산 노드와 함께 사용해야 합니다. 자세한 내용은 목록 연산자 를 참조하세요 .
구성 예 #
일반적인 파일 상호작용 Q&A 시나리오에서 문서 추출기는 LLM 노드의 예비 단계 역할을 하여 애플리케이션에서 파일 정보를 추출하고 이를 다운스트림 LLM 노드로 전달하여 파일과 관련된 사용자 질문에 답할 수 있습니다.이 섹션에서는 일반적인 ChatPDF 예제 워크플로 템플릿을 통해 문서 추출 노드의 사용법을 소개합니다.구성 프로세스:
- 애플리케이션의 파일 업로드를 활성화합니다. “시작” 노드에 파일 변수 하나를
pdf
추가하고 이름을 . - 문서 추출기 노드를 추가하고
pdf
입력 변수에서 변수를 선택합니다. - LLM 노드를 추가하고 시스템 프롬프트에서 문서 추출기 노드의 출력 변수를 선택하세요. LLM은 이 출력 변수를 통해 파일의 내용을 읽을 수 있습니다.
끝 노드에서 LLM 노드의 출력 변수를 선택하여 끝 노드를 구성합니다.
구성 후, 애플리케이션에는 파일 업로드 기능이 추가되어 사용자가 PDF 파일을 업로드하고 대화에 참여할 수 있습니다.