로우코드 플랫폼으로 데이터 추출 자동화하기 | Latenode 튜토리얼

Latenode 으로 데이터 추출 자동화: 단계별 가이드

CSV나 보고서와 같이 대량의 파일로 자주 작업하는 경우 자동화가 큰 도움이 될 수 있습니다. 이 튜토리얼에서는 파일을 읽지 않고도 파일에서 필요한 데이터를 추출하고 저장하는 자동화된 워크플로우를 만드는 방법을 보여드리겠습니다. 세 가지 주요 도구를 사용하겠습니다: ChatGPT Assistant, 온라인 파일 변환기 API, 그리고 최고의 로우코드 자동화 플랫폼인 Latenode 입니다.

이 워크플로를 복제하는 데 관심이 있는 사람들을 위해 설명에 바로 사용할 수 있는 템플릿 링크가 있습니다. 이제 이 워크플로를 만드는 방법에 대해 자세히 알아보겠습니다.

워크플로 안내

먼저 Google 드라이브 계정이 필요합니다. 채용할 사람이 몇 명 있는데 그들이 이력서를 Google 드라이브에 보낸다고 가정해 보겠습니다. 이 워크플로에서는 이름에 'CV'가 포함된 파일을 확인하고, 이러한 PDF 파일을 텍스트로 변환하고, 이름, 이메일, 경력 등의 데이터를 추출한 다음, 마지막으로 이 정보를 Google 스프레드시트에 저장합니다.

초기 설정: 트리거 및 Google 드라이브

Latenode 계정에 로그인하여 새 시나리오를 만듭니다. 일정용 트리거와 개발 및 테스트에 유용한 수동 활성화용 트리거 두 개를 추가합니다. 트리거를 설정한 후 Google 드라이브 섹션으로 전환하여 이름에 'CV'가 포함된 파일을 찾아 다운로드합니다.

Google 드라이브 노드를 설정하려면 인증 토큰이 필요합니다. 인증 토큰이 없는 경우 새 인증 토큰을 만드세요. 드라이브를 지정하고 이름에 'CV'가 포함된 파일을 검색한 다음 노드 실행을 시작합니다. 그러면 콘솔에 파일 세부 정보가 표시됩니다.

파일 변환 및 구문 분석

다음으로 변환기 API를 사용해 다운로드한 PDF 파일을 텍스트로 변환하겠습니다. HTTP 요청 노드를 추가하고 이전 노드와 연결한 다음 API 문서에서 필요한 세부 정보를 입력합니다. 이렇게 하면 PDF 파일이 base64 형식의 텍스트로 변환됩니다.

base64 형식을 디코딩하려면 JavaScript 노드를 사용합니다. 설명에 코드 샘플이 제공되므로 작업을 더 쉽게 할 수 있습니다. 코드를 복사하여 붙여넣고 이전 노드의 데이터 형식과 일치하는지 확인합니다. 노드를 실행하여 콘텐츠를 텍스트 문자열로 디코딩합니다.

ChatGPT를 사용하여 정보 추출

다음으로 ChatGPT 도우미를 사용하여 데이터를 추출합니다. 3개의 ChatGPT 노드를 만듭니다: 스레드 만들기, 메시지 만들기, 답장 받기입니다. OpenAI 계정에서 이름, 이메일 및 경험을 추출하도록 어시스턴트를 설정합니다. 이를 위해서는 어시스턴트 ID가 필요합니다.

먼저, ChatGPT와 대화를 시작할 스레드를 만듭니다. 그런 다음 추출하려는 내용을 자세히 설명하는 메시지를 작성합니다. 디코딩된 파일 내용을 입력으로 사용합니다. 마지막으로, 추출된 데이터가 구조화된 형식으로 포함된 어시스턴트의 응답을 받습니다.

마지막 단계: Google 스프레드시트 채우기

마지막 단계에서는 추출한 데이터를 Google 스프레드시트에 삽입합니다. Google 스프레드시트 노드를 사용하여 단일 행을 추가합니다. Google 스프레드시트에 권한을 부여하고 시트 세부 정보와 열 이름을 지정합니다. ChatGPT로 추출한 데이터를 각 열에 매핑합니다.

노드를 실행하여 스프레드시트에 데이터가 올바르게 채워졌는지 확인합니다. 어시스턴트의 프롬프트를 조정하여 모델의 정확도를 더욱 세밀하게 조정할 수 있습니다.

자동화를 통한 시간 절약

이 자동화된 워크플로는 특히 대량의 보고서를 고용하고 처리하는 등의 작업에서 시간을 크게 절약할 수 있습니다. 일단 배포되면 워크플로가 일정에 따라 트리거되고 새 파일을 자동으로 처리하므로 수동 개입이 줄어듭니다.

이 가이드가 도움이 되었다면 저희 채널을 구독해 보세요. 궁금한 점이 있으면 자동화 등에 대해 논의하는 Discord 커뮤니티에 언제든지 참여하세요. 행복한 자동화!

기타 동영상