색인
당신이 사용하는 경우 ChatGPT 전문적인 작업을 수행하기 위해 해당 작업을 수행하지 않고 남겨질 가능성이 있습니다. 지난 목요일, OpenAI AI 도구가 사용자의 요청을 거부하기 시작하여 사용자가 스스로 작업을 수행해야 함을 나타내거나 작업 완료를 단호하게 거부했다는 보고를 조사 중이라고 네트워크에 공개했습니다. 의 문제 ChatGPT AI가 실수를 할 수 있다는 점을 고려하면 어느 정도 예상은 되지만, ChatGPT "피곤해".
출시 이후, ChatGPT 직장에서 작업을 최적화하기 위한 혁신적인 도구로 인식되었습니다. AI는 1,7억 명의 사용자 기반을 확보한 것으로 추산되며, 유사한 웹의 숫자에 따르면. 28월에 실시된 Reuters/Ipsos 조사에 따르면, 취업 시장에 이 도구를 도입하는 것이 현실화되었으며, 응답자 2.625명(미국의 사무실 전문가) 중 약 22%가 전문 활동에서 이 도구를 정기적으로 사용한다고 밝혔습니다. XNUMX%만이 고용주가 이러한 외부 도구의 사용을 명시적으로 승인했다고 답했습니다.
ChatGPT 오류로 인한 어려움 보고

이용자들은 무례한 대응에 불만을 표시하고 있다. 포구, 이는 귀하의 작업을 더 쉽게 만들어 줄 것입니다. 몇몇 기업가, 기술 임원 및 전문가들은 고급 언어 모델이 다음과 같이 말합니다. OpenAI, GPT-4, 특정 요청에 대한 응답을 거부하기 시작했습니다. 대신, 사람들에게 스스로 작업을 완료하는 방법에 대한 지침을 제공하고 있습니다.
이에 대한 예는 스타트업 창업자인 Matthew Wensing이 GPT-4에 다가오는 달력 날짜 목록을 생성하도록 요청했을 때 발생했습니다. 처음에 봇은 답을 찾기 위해 다른 도구를 사용해 보라고 제안했습니다. 또 다른 경우에는 챗봇에게 약 50줄의 코드를 생성하도록 요청했을 때 Wensing이 X 스크린샷에서 공유한 것처럼 AI 지원 없이 작업을 완료하기 위한 모델로 Wensing이 사용할 수 있는 예제가 응답에 포함되었습니다.
Reddit에서 사용자들은 또한 ChatGPT 할당된 작업에 적절하게 응답해야 하며 원하는 응답에 도달할 때까지 여러 프롬프트를 번갈아 가며 수행해야 합니다. 많은 불만 사항은 ChatGPT 코드 작성 시 일부는 회사가 원래 GPT 모델로 돌아가기를 바라는 바람을 표현합니다. 게다가 응답의 질도 떨어지고 있다는 지적도 나온다.
올해 XNUMX월에도 여전히 스탠포드와 UC 버클리 연구진이 실시한 연구 AI 능력이 쇠퇴하고 있다고 지적했다. 연구자들은 다양한 버전의에 대한 체계적인 분석을 수행했습니다. ChatGPT, 수학적 작업, 코딩 및 시각적 추론에서 모델 역량을 평가하기 위한 엄격한 벤치마크를 개발합니다.
소수를 식별하는 수학적 문제에서, ChatGPT 97,6월에는 488문제 중 500문제를 정확하게 풀면서 2,4%의 정확도를 보였습니다. 그러나 12월에는 정답률이 4개에 불과해 정확도가 52%로 떨어졌다. 특히 챗봇 소프트웨어 코딩 기술 부문의 하락세는 두드러졌다. 연구에 따르면 GPT-10의 경우 코드 해석 플러그인을 사용하지 않고 직접 실행 가능한 응답의 비율이 XNUMX월 XNUMX%에서 XNUMX월 XNUMX%로 감소한 것으로 나타났습니다.
ChatGPT의 문제를 설명하는 것은 무엇입니까?

Reddit의 여러 스레드와 회사 자체 개발자 포럼의 게시물에도 있습니다. OpenAI, 사용자는 시스템이 덜 유용해졌다고 보고하면서 불만을 표시했습니다. 게다가 이번 변화는 고의적인 의도가 있다는 추측도 나왔다. OpenAI, 투자에 대한 노력과 재정 자원을 절약하는 것을 목표로합니다. ChatGPT.
이는 몇 단락의 텍스트만 생성되더라도 더 광범위한 답변을 제공하려면 더 많은 양의 연구가 필요하고 더 많은 계산 능력이 소모되기 때문입니다. 이러한 시스템의 운영은 해당 시스템을 소유한 회사에게 비용이 많이 드는 것으로 간주됩니다.
명백한 인공 지능 피로가 지속되는 동안 사용자는 특정 프롬프트를 통해 플랫폼의 정상적인 기능을 복원하는 자신만의 방법을 발견했습니다. 흥미롭게도 ChatGPT 심호흡을 하고 완전하고 정확한 답변만을 제공하는 교육이 효과적인 것으로 보입니다.
AI를 좀 더 적극적인 형식으로 유도하기 위한 수단으로 다른 요청도 언급됐다. 예를 들어, ChatGPT 해당 주제에 대해 지식이 있는 경우에만 답변하거나, 맥락을 이해하기 위해 추가 질문을 요청하는 것이 답변 개선에 도움이 됩니다. 단계별 설명을 요청하거나 결과 생성 시 토큰 경제를 피하도록 시스템에 지시하는 경우에도 마찬가지입니다.
OpenAI는 이러한 메시지가 문제를 해결하는지 확인하지 않았지만 소셜 미디어에 대한 사용자의 보고서에 따르면 효과적일 수 있습니다. 그 동안 우리는 문제에 대한 확실한 해결책을 제공하는 AI 모델의 다음 업데이트를 기다려야 합니다. ChatGPT 게으름으로.
OpenAI가 "피곤한 ChatGPT"에 대해 말하는 것

최근 권리에 대한 위기를 겪은 후 CEO Sam Altamn이 참여한 “음악 의자”은 OpenAI, 계정을 통해 ChatGPT on X는 점점 더 게으른 것처럼 보이는 모델에 대한 피드백을 구하고 있다고 발표했습니다. 회사는 11월 XNUMX일 이후로 모델을 업데이트하지 않았으며 이는 의도적인 것이 아니라고 밝혔습니다.
GPT4가 점점 게으르다는 의견을 모두 들었습니다! 우리는 11월 XNUMX일 이후로 모델을 업데이트하지 않았으며 이는 확실히 의도적인 것이 아닙니다. 모델 동작은 예측할 수 없으며 이 문제를 해결하기 위해 노력하고 있습니다.
일부 직원은 일부 문제를 소프트웨어 버그로 돌렸지만 오픈에이토요일에 사용자 불만 사항을 계속 조사하고 있다고 보고했습니다. 온라인의 또 다른 게시물에서 회사는 채팅 모델을 교육하는 것이 깨끗한 산업 프로세스가 아니라고 설명했습니다. 다음 진술을 참조하십시오.
채팅 모델 교육은 깨끗한 산업 프로세스가 아닙니다. 동일한 데이터세트를 사용하더라도 다양한 훈련을 실행하면 성격, 글쓰기 스타일, 거부 행동, 평가 성과, 정치적 편견까지 눈에 띄게 다른 모델이 생성될 수 있습니다. 새로운 모델을 출시할 때 우리는 오프라인 평가 지표와 온라인 A/B 테스트를 모두 철저히 테스트합니다. 이러한 모든 결과를 받은 후 우리는 새 모델이 실제 사용자에게 이전 모델보다 개선되었는지 여부에 대한 데이터 기반 결정을 내리려고 노력합니다.
이 프로세스는 새로운 기능으로 웹사이트를 업데이트하는 것과 비슷하기보다는 여러 사람이 새로운 동작을 갖춘 새로운 채팅 모델을 계획, 생성 및 평가하기 위한 장인의 노력과 비슷합니다. 우리는 수백만 가지 사용 사례에 걸쳐 모든 사람에게 더 유능하고 유용한 모델을 만들기 위해 항상 노력하고 있습니다. 그러니 계속해서 댓글을 남겨주세요! 이는 우리가 동적 평가 문제를 인식하는 데 도움이 됩니다.
사용된 비유는 이 프로세스가 새로운 기능으로 웹사이트를 업데이트하는 것과 유사하기보다는 여러 사람이 다양한 동작을 통해 새로운 채팅 모델을 계획, 생성 및 평가하는 수작업에 더 유사하다는 것입니다. 피드백을 계속 제공하면 회사가 모델을 평가하는 데 어려움을 겪는 데 도움이 될 수 있으므로 사용자에게 계속해서 피드백을 제공해 줄 것을 호소했습니다.
참조 :
검토자 글라우콘 바이탈 12년 12월 23일.
쇼메텍에 대해 자세히 알아보세요.
최신 뉴스를 이메일로 받아보시려면 등록하세요.