본문 바로가기

 

 

경제 아지니어의 블로그에 오신 것을 환영합니다.

    인공지능 (chatgpt)과 동행

    챗gpt 모델 (GPT-3, Codex) 및 주요 파라미터 (챗gpt 사용법, 프롬프트 엔지니어링)

    by 아지니어 (아빠 + 엔지니어) 2023. 2. 28.

    챗gpt 모델 (GPT-3, Codex)및 주요 파라미터 (챗gpt 사용법, 프롬프트 엔지니어링)

     

    안녕하세요.

     

    이번 포스팅에서는 챗gpt에서 사용되는 모델 및 관련 주요 파라미터에 대해 공유드리고 이러한 사항들을 직접 테스트해 보실 수 있는 방법에 대해 공유드리고자 합니다.

     

    챗gpt 모델 (GPT-3, Codex) 주요 파라미터 (챗gpt 사용법)

     

     

    챗gpt 모델? 어떤 게 있나요? 동작원리는요?

     

    챗gpt 모델 (GPT-3, Codex), 프롬프트 엔지니어링

     

    우선 챗gpt는 openAI에서 개발한 API 중 하나로, 우리는 openAI에서 지원해 주는 API를 통해 채팅이라는 형태로 인공지능과 대화를 할 수 있는 것입니다.

     

    잘 아시는 것처럼 챗gpt가 지원하는 큰 서비스 중 하나는 일반 자연어처리를 통한 다양한 completion 작업이며 또 다른 하나는 소프트웨어 코드를 분석 또는 생성하는 것이라 할 수 있습니다.

     

    그리고 이러한 서비스를 가능케 하도록 사용된 모델이 바로 GPT-3와 Codex라는 모델입니다.

     

    따라서 챗gpt는 사용자의 프롬프트에 따라 GPT-3와 Codex 모델을 적절히 사용하여 사용자에게 답변을 제공하는 것이며 이러한 모델을 제대로 이해한다면 챗gpt를 통해 프롬프트 엔지니어링을 진행함에 있어 보다 효율적일 수 있어 챗gpt 사용법 중 어쩌면 가장 중요한 부분이라 할 수 있을 듯합니다.

     

    GPT-3와 Codex에 대해 조금 더 자세히 살펴보면 GPT-3는 Generative Pre-trained Transformer 3의 약자로 OpenAI에서 개발한 대규모 언어 모델을 의미하며, Codex는 OpenAI에서 개발한 소프트웨어 자동 생성 모델을 지칭합니다.

     

    1) GPT-3 

     

    - 텍스트 생성, 번역, 요약 등 다양한 자연어 처리 (NLP) 작업을 수행할 수 있는 능력을 갖추고 있으며 인간과 대화하는 챗봇 등 인공지능(AI) 응용 프로그램에서도 사용될 수 있습니다.

     

    - GPT-3는 대규모 데이터셋에서 학습된 Transformer 아키텍처를 사용하여 자연어 처리 작업을 수행하며 이 모델은 입력된 텍스트를 이해하고, 문맥을 파악하여 이어지는 단어나 문장을 예측할 수 있습니다.

     

    2) Codex

     

    - Codex는 기존 소프트웨어 코드를 분석하고, 이를 기반으로 새로운 소프트웨어 코드를 생성하는 능력을 가지고 있으며 이를 통해 개발자가 보다 쉽고 빠르게 코드를 작성할 수 있도록 도와줄 수 있습니다.

     

    - 대규모 코드베이스에서 학습된 인공신경망을 사용하여 소프트웨어 코드를 생성하기에 주어진 요구사항에 맞게 적절한 코드 생성을 위해 코드베이스를 분석할 수 있으며 이를 이해하고 생성하는 능력을 가지고 있습니다.

     

    ※ 혹 아직 챗gpt 사용법에 대해 잘 모르시는 분은 아래의 포스팅을 참조하세요.

    ChatGPT 사용법 (챗GPT 가입부터 어플 그리고 기본 구성까지)

     

    ChatGPT 사용법 (챗GPT 가입부터 어플 그리고 기본 구성까지)

    ChatGPT 사용법 (챗GPT 가입부터 어플 그리고 기본 구성까지) 안녕하세요. 이번 포스팅에서는 최근 가장 핫한 이슈는 chatgpt 사용법에 대해 챗gpt 가입에서부터 어플 그리고 기본 구성까지 쳇gpt를 사

    allmightypapa.tistory.com

     

     

    챗gpt가 사용하는 GPT-3 모델 종류

     

    챗gpt가 자연어 처리를 위해 사용하는 GPT-3의 모델은 또다시 세부 모델로 나누어질 수 있는데, 각 모델은 서로 각각의 특징을 가지고 있어 이를 잘 파악하는 것은 챗gpt 사용법 중 또 다른 중요한 사항이라 할 수 있습니다.

     

    아래는 챗gpt 자연어 처리 모델 중 중요한 5가지에 대한 사항이며, 챗gpt를 다른 응용프로그램에서 API를 통해 프롬프트 엔지니어링을 진행할 시 적절한 모델을 선택하는 것이 비용을 줄이고 올바른 그리고 최적의 답변을 이끌어 내는 첩경이라 할 수 있을 듯합니다.

     

    Davinci

     

    - 주요 기능: Davinci는 1,750억 개의 매개변수가 있는 가장 크고 가장 유능한 GPT-3 모델로, 매우 일관되고 상황에 맞는 응답을 생성할 수 있습니다.


    - 작동 방식: 입력 프롬프트를 분석하고 방대한 양의 데이터에서 학습한 패턴을 기반으로 응답을 생성하여 작동합니다.

     

    - 적용 사례: Davinci는 언어 번역, 콘텐츠 생성 및 제품 추천과 같은 복잡한 작업에 이상적이라 할 수 있습니다.


    - 비용: 0.02달러 / 1000 토큰. 

     

    Curie


    - 주요 기능: Curie는 67억 개의 매개변수가 있는 GPT-3 모델로, 컨텍스트 이해가 필요한 자연어 처리 작업에 이상적입니다.


    - 작동 방식: 입력 프롬프트를 분석하고 방대한 양의 데이터에서 학습한 패턴을 기반으로 응답을 생성하여 작동합니다.

     

    - 적용 사례: Curie는 챗봇, 콘텐츠 생성 및 언어 번역에 이상적입니다.

     

    - 비용: 0.002달러 / 1000 토큰.

     

    Babbage

     

    - 주요 기능: Babbage는 13억 개의 매개변수가 포함된 GPT-3 모델로, 더 단순한 자연어 처리 작업에 이상적입니다.


    - 작동 방식: 입력 프롬프트를 분석하고 방대한 양의 데이터에서 학습한 패턴을 기반으로 응답을 생성하여 작동합니다.


    - 적용 사례: Babbage는 간단한 챗봇, 언어 번역 및 Q&A 애플리케이션에 이상적입니다.


    - 비용: 0.005달러 / 1000 토큰.

     

    Ada

     

    - 주요 기능: Ada는 12억 개의 매개변수가 포함된 GPT-3 모델로, 텍스트 프롬프트에 대해 일관되고 적절한 응답을 생성하는 데 이상적입니다.


    - 작동 방식: 입력 프롬프트를 분석하고 방대한 양의 데이터에서 학습한 패턴을 기반으로 응답을 생성하여 작동합니다.


    - 적용 사례: Ada는 챗봇, 콘텐츠 생성 및 언어 번역에 이상적입니다.


    - 비용: 0.0004달러 / 1000 토큰.

     

    위에서 확인할 수 있는 것처럼 매개변수를 가장 많이 사용한 다빈치 (Davinci) 모델이 가장 파워풀하며 음악 작곡이나 스토리 텔링과 같은 창의적인 작업의 프롬프트 엔지니어링에 가장 적합하다 할 수 있습니다.

     

    이에 대조적으로 Ada 모델의 경우 12억 개의 매개변수만을 통해 학습되었기에 창의적인 작업보다는 단순 언어 번역 등에 적합하다 할 수 있을 듯하며 비용적인 측면에서도 1000 토큰 당 0.0004 달러로 가장 저렴함을 알 수 있습니다.

     

    따라서 챗gpt에서 지원하는 모델의 특징과 가격 정보 등을 올바로 이해하고 이를 통해 프롬프트 엔지니어링 진행 시 적절한 모델을 선택하는 것은 챗gpt 사용법 중 중요한 부분 중 하나라 할 수 있습니다.

     

    ※ 여기서 토큰이 의미하는 바와 가격이 어떻게 책정되는 지 궁금하시다면 아래의 포스팅을 참조하세요.

    Chatgpt 사용료 한눈에 (챗gpt 플러스 구독료, 무료기간, 유료)

     

    Chatgpt 사용료 한눈에 (챗gpt 플러스 구독료, 무료기간, 유료)

    Chatgpt 사용료 한눈에 (챗gpt 플러스 구독료, 무료기간, 챗gpt 유료) 안녕하세요. 이번 포스팅에서는 chatgpt 무료기간과 유료 비용 그리고 향후 3월부터 적용될 챗gpt 플러스 구독료에 대해 손쉽게 알

    allmightypapa.tistory.com

    1.  

     

    챗gpt 여러 모델을 직접 실험해 볼 수 있나요?

     

    챗gpt 모델 (GPT-3, Codex), source: openai.com

     

    https://platform.openai.com/playground

     

    가능합니다.

     

    위와 같이 openai에서 지원하는 playground에 접속하시면 왼쪽 메뉴의 'Model' 부분에서 좀 전에 설명해 드린 모델 중 하나를 직접 선택하여 실험해 보실 수 있습니다.

     

    (playground 사용법은 매우 간단하여 텍스트창에 질문을 입력하시고 'submit' 버튼을 클릭하시면 됩니다.)

     

    특정 질문과 같은 입력 하여 프롬프트 엔지니어링을 진행하고, 각 모델을 바꾸어 가며 결과를 확인해 본다면 해당 차이점을 느끼실 수 있으리라 봅니다.

     

    만약 엑셀이나 파이썬과 같은 프로그램에서 챗gpt API 키를 활용하여 응용하신다면 코딩으로 직접 챗gpt 모델을 선정하실 수도 있으니 참고하시기 바랍니다.

     

    ※ 엑셀에서 챗gpt API 키 및 챗gpt 모델을 선정하여 간단한 응용프로그램을 만들어 본 예는 아래의 포스팅을 참조하세요.

    챗gpt 사용법: Chatgpt API 활용하여 엑셀에서 프롬프트 엔지니어링

     

    챗gpt 사용법: Chatgpt API 활용하여 엑셀에서 프롬프트 엔지니어링

    챗gpt 사용법: Chatgpt API 활용하여 엑셀에서 프롬프트 엔지니어링 안녕하세요. 이번 포스팅에서는 지난 기본적인 챗gpt 사용법에 이은 챗gpt API를 활용하여 엑셀에서 프롬프트 엔지니어링을 진행하

    allmightypapa.tistory.com

     

     

    챗gpt 파라미터는 무엇이 있나요?

     

    챗gpt에서 지원하는 파리미터의 수는 어떤 API에 대해 이야기하느냐에 따라 답변이 천차만별일 수 있는데, 해당 포스팅에서는 챗gpt 사용법의 일환으로 챗gpt를 통해 프롬프트 엔지니어링 진행 시 해당 답변의 다양성을 결정짓는 중요한 파라미터에 대해 소개해 드리려 합니다.

     

    이는 Temperature라는 파라미터로 해당 파라미터를 변경하면 사용자의 질문에 대한 답변이 일괄적이지 않고 매우 다양하게 제공되기에 보다 창의적인 프롬프트 엔지니어링을 하시는 분들에게는 반드시 알아야 할 사항이라 할 수 있습니다.

     

    Temerature 파라미터는 0에서 1의 값을 가지며, 높은 값은 더욱 창의적인 결과를 생성하고 낮은 값은 예측 가능한 또는 동일한 결과를 생성하도록 지원됩니다.

     

    아래 그림을 참조하시면 playground에서 챗gpt 모델 아래 부분에 temperature 파라미터를 변경할 수 있는 곳이 있는데, 여기를 통해 해당 값을 변경해 주시면 스스로 해당 결과를 테스트해 보실 수 있습니다.

     

    챗gpt 파라미터, temperature, source: openai.com

     

    아래는 제가 temperature 값을 변경하여 임의로 진행한 결과입니다.

     

    1) Temperature를 0으로 설정한 경우에는 '삶이 무엇일까'라는 2번의 질문에 동일한 답변을 제공하는 것을 확인할 수 있습니다.

     

    챗gpt 사용법, 파라미터, temperature, source: openai.com

     

    2) 두번째 사례에서는 Temperature를 0.75로 설정했으며 이 경우에는 '삶이 무엇일까'라는 2번의 질문에 서로 상이한 답변을 제공하는 것을 확인할 수 있습니다.

     

    챗gpt 사용법, 파라미터, temperature, source: openai.com

     

     

    오늘은 챗gpt 사용법 중 가장 중요한 부분이라고 개인적으로 판단되는 챗gpt 모델에 대한 간단한 이해와 temperature라는 주요 파라미터에 대해 함께 알아보았습니다.

     

    개인적인 판단으로는 프롬프트 엔지니어링은 향후에도 지속적으로 요구되어지는 스킬 중 하나로 여겨질 것이며 올바르고 효과적인 프롬프트 엔지니어링을 위해서는 사용하는 ai 모델의 특징에 대해 보다 깊은 이해가 선행되어야 할 것으로 보여집니다.

     

    '좋아요' 또는 댓글은 제가 포스팅을 이어나가는 데 큰 힘이 됩니다.

    ※ 아래의 포스팅들도 읽어보시기를 추천드립니다.

    생성 AI를 활용한 AI 작곡! 챗GPT와 뮤버트 (Mubert)가 결합하면 가능 (text-to-music)!

     

    생성 AI를 활용한 AI 작곡! 챗GPT와 뮤버트 (Mubert)가 결합하면 가능 (text-to-music)!

    생성 AI를 활용한 AI 작곡! 챗GPT와 뮤버트가 결합하면 가능 (text to music)! 안녕하세요. 이번 포스팅에서는 AI 작곡을 가능케하는 새로이 발견한 생성 ai에 대해 공유해 드리고자 합니다. 지난 포스팅

    allmightypapa.tistory.com

    사진 화질 높이기, 사진 크기 조절도 이제는 AI로 프로페셔널하게!

     

    사진 화질 높이기, 사진 크기 조절도 이제는 AI로 프로페셔널하게!

    사진 화질 높이기, 사진 크기 조절도 이제는 AI로 프로페셔널하게! 안녕하세요. 이번 포스팅에서는 AI를 이용하여 전문적으로 사진 화질 높이기와 사진 크기 조절하는 법에 대해 공유해 드리고자

    allmightypapa.tistory.com

    말하는 AI 아바타 만들기, 미드저니와 D-ID 함께라면 5분 만에 완성!

     

    말하는 AI 아바타 만들기, 미드저니와 D-ID 함께라면 5분 만에 완성!

    말하는 AI 아바타 만들기, 미드저니와 D-ID 함께라면 5분 만에 완성! 안녕하세요 이번 포스팅에서는 지난번 설명드린 미드저니와 새로운 AI 영상 플랫폼인 D-ID를 활용하여 순식간에 말하는 AI 아바

    allmightypapa.tistory.com

    마이크로소프트 챗gpt-4와 챗gpt-3 비교!, ms 빙 chatgpt, 무엇이 다를까요 (무료 / 유료)?

     

    마이크로소프트 챗gpt-4와 챗gpt-3 비교!, ms 빙 chatgpt, 무엇이 다를까요 (무료 / 유료)?

    마이크로소프트 챗gpt-4와 챗gpt-3 비교!, ms 빙 chatgpt, 무엇이 다를까요 (무료 / 유료)? 안녕하세요. 이번 포스팅에서는 지난번 간략히 소개해 드린 마이크로소프트 챗gpt-4에 대해 좀 더 자세히 알아

    allmightypapa.tistory.com

     

    댓글