자카르타 - GPT-4는 현재 시장에서 가장 우수한 생성 AI 도구이지만 이것이 미래를 내다보지 않는다는 의미는 아닙니다. OpenAI CEO인 Sam Altman은 정기적으로 GPT-5에 대한 힌트를 제공하며, 곧 새롭고 향상된 AI 모델을 보게 될 것 같습니다.

GPT-5의 구체적인 출시 날짜는 없지만 많은 사람들은 대중이 머지않아 이를 보게 될 것이라고 생각합니다. 그러나 출시 시기와 관계없이 GPT-5가 출시될 때 볼 수 있을 것으로 예상되는 몇 가지 주요 기능이 있습니다.

OpenAI의 GPT-5란 무엇입니까?

GPT-5는 OpenAI의 GPT-4 AI 모델의 후속 모델로, 시장에서 가장 강력한 생성 모델이 될 것으로 예상됩니다. GPT-5의 공식 출시 날짜는 없지만, 이 모델이 2024년 여름에 출시될 수 있다는 징후가 있습니다. 현재 이 모델에 대한 세부 정보는 거의 알려져 있지 않지만 어느 정도 확신할 수 있는 몇 가지 사항이 있습니다. 확실성:

OpenAI는 미국 특허청에 해당 이름의 상표를 등록했습니다.

몇몇 OpenAI 경영진은 이 모델의 가능한 기능에 대해 논의하거나 암시했습니다.

OpenAI CEO인 Sam Altman은 2024년 3월 Lex Fridman과의 YouTube 인터뷰에서 이 모델을 반복해서 언급했습니다.

이 모든 것은 하나의 흥미로운 현실을 가리킵니다. GPT-5가 곧 출시된다는 것입니다! 그러나 현 시점에서는 여전히 추측이 많다. 그러나 우리가 예상했던 몇 가지 사항이 이 모델에 포함될 것으로 확신합니다. 그 중 일부는 다음과 같습니다.

더 많은 다중 모드

GPT AI 모델 제품군의 가장 흥미로운 개선 사항 중 하나는 다중 모드입니다. 다중 양식은 텍스트뿐만 아니라 이미지, 오디오, 비디오와 같은 다른 유형의 입력도 처리하는 AI 모델의 기능입니다.

다중 양식은 GPT 모델 제품군의 향후 발전을 위한 중요한 이정표가 될 것입니다. GPT-4는 이미 이미지 입력 및 출력 관리에 능숙하며 오디오 및 비디오 처리에 대한 개선은 OpenAI의 다음 이정표이며 GPT-5는 시작하기에 좋은 곳입니다.

Google은 이미 Gemini AI 모델을 통해 이러한 종류의 다중 모드를 통해 상당한 진전을 이루고 있습니다. OpenAI가 응답하지 않으면 이상할 것입니다. Unconfused Me 팟캐스트[PDF 사본]에서 Bill Gates는 OpenAI CEO인 Sam Altman에게 향후 2년 동안 GPT 시리즈에서 어떤 이정표가 있을 것으로 예상하는지 물었습니다. 대답? 비디오 처리.

따라서 GPT-5의 경우 요청으로 비디오를 업로드하고, 비디오를 직접 생성하고, 쿼리 텍스트로 비디오를 편집하고, 비디오에서 세그먼트를 추출하고, 대용량 비디오 파일에서 특정 장면을 찾는 등 비디오를 가지고 놀 수 있을 것으로 기대됩니다. 우리는 오디오 파일에도 비슷한 작업을 수행할 수 있기를 바랍니다. 네, 큰 요청이에요. 그러나 AI의 발전 속도를 고려하면 이는 매우 합리적인 기대이다.

더 크고 효율적인 컨텍스트 창

시장에서 가장 발전된 AI 모델 중 하나임에도 불구하고 GPT AI 모델 제품군은 컨텍스트 창이 상당히 작습니다. 예를 들어 Anthropic의 Claude 3에는 200,000개 토큰의 컨텍스트 창이 있는 반면, Google의 Gemini는 최대 1백만 개의 토큰(표준 사용의 경우 128,000개)을 처리할 수 있습니다.

이에 비해 GPT-4는 약 128,000개의 토큰으로 비교적 작은 컨텍스트 창을 가지며 ChatGPT와 같은 인터페이스에서 실제로 사용할 수 있는 토큰은 약 32,000개 이하입니다.

고급 다중 양식이 등장하면서 상황 창의 증가는 거의 불가피합니다. 아마도 2~4배 정도 증가하면 충분하겠지만, 우리는 약 10배 정도 증가할 것으로 예상합니다. 이를 통해 GPT-5는 훨씬 더 효율적인 방식으로 훨씬 더 많은 정보를 처리할 수 있습니다. 그러나 컨텍스트 창이 더 크다고 해서 항상 더 좋은 것은 아닙니다. 따라서 단순히 컨텍스트 창을 늘리는 것이 아니라 컨텍스트 처리 효율성이 높아지는 것을 확인하고 싶습니다.

GPT 에이전트

GPT-5 릴리스의 가장 흥미로운 가능성 중 하나는 GPT Agent의 등장입니다. AI의 맥락에서 "게임 체인저"라는 용어가 과도하게 사용될 수 있지만 GPT 에이전트는 모든 실제적인 의미에서 게임을 진정으로 변화시킬 것입니다. 하지만 이것이 얼마나 판도를 바꾸는가?

오늘날 GPT-4와 같은 AI 모델은 작업을 완료하는 데 도움이 될 수 있습니다. 그들은 이메일을 쓰고, 농담을 하고, 수학 문제를 풀고, 블로그 게시물을 작성해 줄 수 있습니다. 그러나 특정 작업만 수행할 수 있으며 작업을 완료하는 데 필요한 일련의 관련 작업을 완료할 수는 없습니다.

당신이 웹 개발자라고 가정해보자. 업무의 일환으로 디자인, 코드 작성, 문제 해결 등 많은 일을 해야 합니다. 현재는 이러한 작업 중 일부만 AI 모델에 단계적으로 할당할 수 있습니다. 어쩌면 GPT-4 모델에게 홈 페이지에 대한 코드를 작성하도록 요청한 다음 연락처 페이지, 정보 페이지 등에 대해 해당 코드를 작성하도록 요청할 수 있습니다. 이러한 작업을 반복적으로 완료해야 합니다. 그리고 모델이 해결할 수 없는 작업이 있습니다.

특정 하위 작업에 대해 AI 모델을 쿼리하는 이러한 점진적인 프로세스는 시간이 많이 걸리고 비효율적입니다. 이 시나리오에서 웹 개발자인 귀하는 관련 작업의 전체 세트를 완료할 때까지 AI 모델의 작업을 하나씩 조정하고 쿼리하는 역할을 담당하는 인간 에이전트입니다.

GPT 에이전트는 스스로 생각하고 복잡한 작업의 모든 하위 집합을 자율적으로 처리할 수 있는 GPT-5가 조정하는 전용 전문가 봇을 약속합니다. '자신의 사고'와 '자율'을 강조합니다.

따라서 GPT-5가 GPT Agent와 함께 제공되는 경우 단순히 "홈 페이지용 코드 작성"이 아닌 "Maxwell Timothy를 위한 포트폴리오 사이트 구축"을 요청할 수 있습니다. 그런 다음 GPT-5는 이론적으로 전문 AI 에이전트를 호출하여 웹사이트 구축에 필요한 다양한 하위 작업을 처리함으로써 스스로 명령을 내릴 수 있습니다.

하나의 GPT를 호출하여 웹에서 Maxwell Timothy에 대한 정보를 수집하고, 또 다른 에이전트는 다양한 페이지에 대한 코드를 작성하고, 또 다른 에이전트는 이미지를 생성 및 최적화하고, 또 다른 AI 에이전트는 사이트 구현을 수행할 수 있으며 이 모든 작업을 반복적인 지침 없이 수행할 수 있습니다. 사람에게서.

환각 감소

OpenAI가 AI 모델의 환각 문제를 해결하는 데 진전을 이루었지만 GPT-5의 진정한 테스트는 의료, 항공, 항공 등 중요하고 중요한 영역에서 AI의 광범위한 채택을 방해하는 지속적인 환각 문제를 해결하는 능력이 될 것입니다. 그리고 사이버 보안.

이는 모두 AI의 과도한 개입으로 큰 이익을 얻을 수 있지만 현재는 도입이 쉽지 않은 영역입니다.

분명히 말하면, 이 맥락에서 환각은 AI 모델이 합리적으로 들리지만 완전히 높은 수준의 신뢰도로 조작된 정보를 생성하고 제시하는 상황을 의미합니다.

GPT-4가 진단 시스템에 통합되어 환자 증상과 의료 보고서를 분석하는 시나리오를 상상해 보세요. 환각을 통해 AI는 자신있게 잘못된 진단을 제공하거나 상상한 사실과 잘못된 논리를 기반으로 잠재적으로 위험한 치료 경로를 추천할 수 있습니다. 의료 분야에서 그러한 실수의 결과는 매우 치명적일 수 있습니다.

항공, 원자력, 해양 작전, 사이버 보안과 같은 다른 중요한 영역에도 유사한 유보가 적용됩니다. 우리는 GPT-5가 환각 문제를 완전히 해결할 것이라고 기대하지는 않지만, 그러한 사건의 가능성을 크게 줄일 것으로 기대합니다.

우리가 매우 기대되는 AI 모델의 공식 출시를 간절히 기다리고 있는 가운데 한 가지 확실한 점은 GPT-5가 인공 지능으로 가능한 것의 경계를 재정의하고 인간과 기계 간의 협력과 혁신의 새로운 시대를 열 수 있는 잠재력을 가지고 있다는 것입니다. .


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)