AI

[방은주의 AI 이야기] 마침내 발표된 GPT4···어떤 '물건'인가

H.Hoper 2023. 3. 15. 23:12

GPT1부터 4까지 자세히 비교하면서 GPT4를 소개한 글이 있어 공유합니다.
본문의 내용은 원문을 기반으로 제가 임의로 작성한 내용들도 있으니, 꼭 원문을 보시길 추천합니다. ^^

🔔 GPT history(?)
모델명: 출시시기 / 파라미터수 / 특징
🚩 GPT-1: 2018년 / 1,700만개 / Unlabeled 데이터 학습, 특정 주제 분류, 분석등의 응용작업
🚩 GPT-2: 2019년 / 15억개 / 비지도 학습 기반의 패턴인식으로 대용량 데이터 학습
🚩 GPT-3: 2020년 / 1,750억개 / 자가학습 레이어로 파라미터수 100백 이상 증가, 사람처럼 글 작성, 코딩, 번역, 요약 가능
🚩 InstructGPT: 2022년 / 인간피드백기반 강화학습(RLHF)적용, 답변의 정확도와 안정성 증가
🚩 GPT-3.5: 2022년 / 1,750억개 / InstrcutGPT와 같은 RLHF기반 모델 학습
🚩 GPT-4: 2023년 / 미공개(5,000억개 추정) / 이미지를 지원하는 멀티모달

🔔 GPT-4 주요 특징
🚩 멀티모달AI: 이미지 인식 기능 추가. 그림 입력 및 그림 내용 기반 대화 가능. 텍스트to이미지 등 가능. 단독 파트너인 ‘비마이아이즈(Be My Eyes)’와 함께 이 기능을 테스트 중.
단, 아직 오디오와 비디오 미지원.
cf)OpenAI의 '달리(DALL-E)'와 달리2 / 메타의 'Make-A-Video'/구글'Imagine video' / MS의 '비쥬얼GPT' / LG'틸다' /
🚩 단어 생성 및 처리 능력 강화: 세션당 최대 토큰 4096 -> 8000단어 / 26개 국어 지원
그래서, 미국 모의 변호사 시험 상위 10% 점수로 통과 / SAT 1300점/1600만점 중
🚩 트랜스포머 기술: 문장 속 단어와 같은 순차 데이터 내의 관계를 추적해 맥락과 의미를 학습하는 신경망 = 어텐션 or 셀프어텐션
🚩 안정성 강화: 이전버전 보다 허용되지 않은 콘텐츠에 대한 요청에 응답할 가능성이 82% 낮으며, 특정 사실성 테스트에서는 40% 높은 점수, 의학적 조언이나 자해와 관련된 요청 등 민감한 요청에 대해서는 OpenAI의 정책에 따른다
🚩 단점
- 환각문제: 사실과 전혀 다른 답을 천연덕스럽게 내놓는 할루시네이션(환각) 문제는 본질적으로 해결되지 않았고, 여전히 적지 않은 오류 존재
- 2021년 9월 이후에 발생한 사건에 대한 지식 부족
- 여전히 미래에 대한 예측에 대한 질문에 대해서는 모호한 답변. (아마도 허용되지 않은 콘텐츠 영역으로 포함되어 있는지도..^^)

🔔 GPT-4 사용 방법
- 챗GPT 유료상품인 ‘챗GPT 플러스’를 통해 사용
- 개발자는 대기자 명단에 등록하여 API에 액세스

💻 ChatGPT: https://chat.openai.com/chat
💻 ChatGPT plus: https://openai.com/blog/chatgpt-plus
💻 OpenAI의 ChatGPT 리서치 내용: https://openai.com/research/gpt-4

 

GPT-4

We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhi

openai.com

출처: [방은주의 AI 이야기] 마침내 발표된 GPT4···어떤 '물건'인가