안녕하세요. 오늘은 최근에 새롭게 출시된 ChatGPT 4o에 대해서 알아보겠습니다. 어떤 기능들이 추가되었고, 성능적으로 어떻게 개선이 되었는지 낱낱이 파헤쳐 보겠습니다. GPT-4o는 텍스트 뿐만 아니라, 오디오, 이미지, 비디오의 조합을 입력할 수 있고, 해당 입력을 바탕으로 원하는 답변을 제공합니다. 특히 기존에는 이미지 생성이나, 긴 답변을 요구할 때 많은 시간이 걸려 불편한 경우가 있었는데, GPT-4o 모델은 평균 3.2초로 굉장히 빠르게 답변해 줄 수 있다고 합니다. 영어나 코딩에 관련된 답변은 기존의 GPT-4 Turbo와 같고, 다른 언어에 대해서 엄청난 성능 향상을 두어 이제는 귀찮게 문맥을 일일이 수정할 필요 없이 한국어로 바로 원하는 답변을 얻어낼 수 있을 것입니다. 또한 음성 인식에 큰 성능 향상을 보여, 텍스트가 아닌 음성 대화 형식으로 간편하게 활용할 수 있습니다. 아이언맨에 나오는 자비스가 실제로 저희의 삶에 사용되는 것입니다.
기존에 너무 느린 답변으로 불편하셨던 분들, 원하는 이미지가 생성되지 않거나, 퀄리티가 낮아서 고민이셨던 분들, 음성만으로 편리하게 AI를 활용하고 싶으신 분들에게 꼭 필요한 모델이 나왔습니다. 지금부터 어떤 기능이 있고 어떤 성능을 보이는지 함께 알아보도록 하겠습니다.
ChatGPT 4o 추가된 기능
1. 글자 이미지 생성
기존에 이미지를 생성해보신 분들이라면, ChatGPT는 원하는 글자를 이미지로 생성하지 못한다는 것을 눈치채셨을 것입니다. 저도 로고를 만들거나, 포스터를 만들기 위해 GPT-4 모델에게 특정 글자를 포함하는 이미지를 생성해 달라고 해 본 경험이 있는데, 항상 글자를 조금 이상하게 틀리거나, 아예 이상한 문자를 만들어 내어 화만 나고 포기했던 적이 있습니다. 하지만 이번에 강화된 ChatGPT-4o 모델에서는 원하는 글씨를 그대로 이미지로 만들어 낼 수 있습니다.
2. 기존의 이미지로 새로운 이미지 생성
원래 있던 캐릭터나, 이미지를 활용하여 다른 장면을 만들고 싶을 때 꼭 필요한 기능입니다. 기존에는 특정 캐릭터를 입력으로 주고 다른 이미지를 생성해 달라고 하면, 그 캐릭터를 그대로 나타내어 주지 못하고 완전히 새로운 이미지를 만들었습니다. 하지만 ChatGPT 4o는 해당 캐릭터가 그대로 다른 장면에서 다른 행동을 하고 있게 만들어 낼 수 있습니다. 따라서 웹툰, 애니메이션 등을 만들거나, 특정 캐릭터로 다양한 장면을 만들어 내고 싶으신 분들에게 아주 유용한 기능입니다. 즉 연속적인 이미지를 생성하고 싶으신 분들에게 필수적인 기능입니다.
3. 이미지 합치기
ChatGPT 4o를 활용하면 여러개의 이미지를 합쳐서 새로운 이미지를 생성할 수 있습니다. 예를 들어 특정 인물 사진과 배경 사진을 제공하여 해당 인물이 해당 배경에 있는 이미지를 만들어 낼 수도 있고, 두 명의 사람 이미지를 제공하여 해당 인물들이 함께 있는 이미지를 생성해 낼 수 있습니다.
다음과 같이 두 명의 인물 이미지를 합쳐 완벽한 영화 포스터 이미지를 생성해 냈습니다. 전혀 이질감이 없이 잘 합쳐주는 것 같습니다.
4. 이미지 스타일 변경하기
ChatGPT 4o는 기존에 있는 이미지의 스타일을 변경할 수 있습니다. GPT4에서는 이미지를 입력으로 주고 조금 수정해 달라고 하면 이미지 전체를 바꿔버리는 문제점이 있었는데, GPT4o 모델에서는 기존 이미지는 그대로 두고, 스타일만 수정할 수 있습니다.
위의 결과물들 처럼, 기존의 형태는 그대로 두고, 색의 조합만 바꿔서 새로운 스타일을 만들어 냈습니다. 정말 놀라운 기능입니다.
5. 로고 제작하기
기존에 사용하던 로고가 있으신 분들에게 정말 좋은 기능입니다. 기존의 로고 사진을 입력하고 해당 로고를 바탕으로 어떠한 물건을 만들어 달라고 하면, 해당 로고가 박힌 물건을 제작해 줍니다. 만약 굿즈나 브랜드 아이템을 만들 생각이 있으신 분들에게는 정말 유용한 기능인 것 같습니다.
GPT-4o의 로고와 동전 이미지를 합쳐 GPT 동전을 만들어 냈습니다. 정말 이쁘게 잘 만든 것 같습니다.
나무 목재에 Open AI의 로고를 넣는 것도 정말 자연스럽게 잘 생성해 주었습니다.
6. 폰트 제작하기
원하는 폰트를 ChatGPT 4o를 통해 제작할 수 있습니다. 원하는 문자와 원하는 느낌의 폰트를 입력하면, 해당 입력에 맞는 폰트의 문자들을 제공해 줍니다. 최근에 로고나 디자인을 하면서 원하는 폰트를 찾기 힘들거나, 찾아도 유료인 경우가 많았는데 해당 기능을 이용하면 무료로 원하는 폰트를 생성해 낼 수 있습니다.
7. 3D 영상 제작하기
ChatGPT 4o에게 원하는 이미지를 제공하고 3D 이미지로 변경을 요구하면, 짧은 영상으로 해당 이미지를 360도 회전하여 보여주는 기능입니다.
8. 텍스트를 손글씨로 변경
해당 기능은 원하는 텍스트를 입력하면 사람이 적은 것처럼 이미지를 생성해 주는 기능입니다. 노트에 필기를 한 것처럼 이미지를 생성해주는데 정말 신기합니다. 해당 기능은 많은 학생들이 숙제를 직접 한 것처럼 꾸미는 귀여운 악용을 할 수 있어 조금 우려가 되는 기능이지만, 정말 깜짝 놀랄 만큼 신기한 기능입니다.
9. 음성 분석 기능
ChatGPT 4o는 음성 인식 기술에 특히나 혁신적인 발전을 해냈다고 자부하고 있습니다. 음성 분석 기능은, 음성을 입력하면 해당 음성을 분석하여 어떤 상황인지, 어떤 대화를 하고 있는 지 등 세부적으로 답변해 줍니다. 위급 상황감지, 회의 요약, 강의 요 등 다양한 분야에서 유용하게 사용될 수 있을 것 같습니다.
10. 로고 스타일 변경하기
마지막으로 로고나, 이미지를 입력하고 원하는 느낌을 상세하게 전달하면, 해당 로고나 이미지의 형태는 그대로 유지하고 스타일, 색상 등을 변경할 수 있습니다. 해당 기능은 브랜드나 로고, 포스터, 굿즈 제작 등 여러 분야에서 정말 유용하게 쓰일 것 같습니다.
마무리
오늘은 ChatGPT 4o에서 추가된 기능 10가지와 해당 기능들의 성능을 직접 결과물을 보며 함께 확인해 보았습니다. 기존에 너무 느린 답변과 만족스럽지 못한 결과물, 잦은 서버 다운 현상으로 ChatGPT를 떠나가는 사용자들이 많았는데, ChatGPT 4o의 등장으로 다시 한번 Open AI를 믿고 사용해볼 수 있을 것 같습니다. 특히, 기존에 어떤 문제점들이 있었는지 정확하게 파악하고 사용자들의 불편함을 해소해 주었다는 점에서 OpenAI는 정말 좋은 회사라는 것을 다시 한번 느끼게 되었습니다. 올해에는 ChatGPT5와 동영상을 제작해주는 소라 모델이 추가적으로 나올 수 있는데, 해당 모델들의 성능은 얼마나 좋을지 정말 기대가 됩니다. 해당 모델들이 나오면 바로 포스팅을 작성하여 여러분께 공유 드리겠습니다. 오늘도 방문해주셔서 감사합니다.
해당 내용들이 더욱 궁금하신 분들은 Open AI 사이트를 방문하여 내용을 확인해 보시길 바랍니다.
Open AI ChatGPT 4o 바로가기 : https://openai.com/index/hello-gpt-4o/