마이크로소프트는 기존 모델의 무게를 변경하지 않고 AI 에이전트의 성능을 향상시킬 수 있는 오픈 소스 프레임워크인 SkillOpt를 발표했습니다.

6월 15일 월요일 벤처비트가 보도한 바와 같이, 스킬옵트는 AI 에이전트의 "기술"을 개선하도록 설계되었습니다. AI 에이전트는 코드를 작성하거나 문서를 읽거나 디지털 도구를 사용하는 등의 특정 작업을 독립적으로 수행 할 수있는 인공 지능 시스템입니다.

의도 된 기술은 markdown 문서 (.md)에 지침 집합입니다. 내용은 작업 규칙, 출력 형식, 도구 사용 방법, 오류를 피하는 단계 등 일 수 있습니다.

이전에는 AI 에이전트의 기술이 일반적으로 수동으로 개선되었습니다. 개발자는 지시를 하나씩 변경해야했습니다. 그 과정은 종종 추측과 같습니다. AI를 더 정확하게 만드는 문장은 무엇이며, 실제로 성능을 저하시키는 문장은 무엇입니까.

SkillOpt는 이러한 프로세스를 더 측정 가능하게 만들려고 노력합니다. Microsoft는 기술 문서를 훈련 할 수있는 객체처럼 다룹니다. 이 시스템은 AI 에이전트의 작업 결과를 읽고 오류 패턴을 찾은 다음 지시에 대한 변경 사항을 제안합니다.

그러나 변경은 즉시 사용되지 않습니다. SkillOpt는 먼저 테스트합니다. 성능이 향상되면 변경이 수락됩니다. 하락하면 변경이 거절되고 반복되지 않도록 나쁜 예로 저장됩니다.

마이크로소프트 리서치 아시아의 Yifan Yang 수석 연구 SDE는 주요 문제는 기술을 변경하는 것뿐만 아니라 변경이 실제로 성능을 향상시키는지 확인하는 것이라고 말했습니다.

"문제는 팀이 기술을 변경할 수 있는지 여부가 아니라, 그 변화가 개선이라는 것을 보장할 수 없다는 것입니다." 양은 벤처 비트에 말했습니다.

양에 따르면 문제의 원인은 세 가지입니다. 변화가 너무 멀리 갔거나 검증되지 않았거나 오래된 오류가 계속 반복되고 시스템이 "부정적인 기억"이 없기 때문입니다.

그는 테스트되지 않은 지시 변경이 SpreadsheetBench에서 GPT-5.5 점수를 41.8에서 41.1로 낮추었다고 예를 들어 설명했습니다.

SkillOpt는 딥 러닝과 비슷한 원칙을 사용합니다. 변화의 양, 검증 테스트, 유용성이 입증 된 학습을 유지하는 메커니즘이 있습니다. 그러나 SkillOpt는 AI 모델의 가중치를 터치하지 않습니다. 모델의 가중치는 AI 모델이 어떻게 작동하는지 결정하는 핵심 매개 변수입니다.

벤처비트가 인용한 테스트에서 마이크로소프트는 GPT-5.5에서 GPT-5.4-mini 및 Qwen3.5-4B에 이르기까지 다양한 모델에서 SkillOpt를 시도했습니다. 테스트에는 질문과 답변, 도구를 사용한 코드 작성 및 텍스트와 이미지를 결합한 다중 문서 추론이 포함되었습니다.

결과적으로 SkillOpt는 테스트 된 모든 52 조합의 모델, 척도 및 작업 환경에서 성능을 향상시킵니다. 척도는 AI 모델의 능력을 측정하기위한 표준 테스트입니다. GPT-5.5에서 평균 향상은 23.5 포인트에 달했으며 능력이 없을 때와 비교했습니다.

작은 모델도 큰 이점을 얻었습니다. GPT-5.4-nano는 다중 문서 질문에 점수를 거의 두 배로 늘리고 연속적인 의사 결정 작업에서 성능을 두 배로 늘립니다.

기업에게 이 기술은 많은 AI 작업이 여전히 중요한 것에 잘못된 경향이 있기 때문에 매력적입니다. 계약서, 청구서 및 양식에서 숫자를 추출하고, 형식을 유지하고, 도구를 올바르게 사용하고, 감사를 받을 수 있는 결과를 생성합니다.

이는 AI가 답을 외우기 때문이 아니라 시스템이 작업 절차를 배우면서 더 나아진 것이라고 말했습니다.

SkillOpt는 환경 간으로도 이동할 수 있습니다. 예를 들어 Codex CLI에서 훈련된 스프레드시트 스킬은 Claude Code에서 사용할 수 있으며 Claude Code의 기본 기능에 비해 59.7 포인트의 향상을 가져옵니다.

기업에게 SkillOpt는 일반적으로 비싸고 복잡한 기본 모델을 다시 훈련하지 않고도 AI 에이전트를보다 규칙적이고 일관되며 쉽게 감사 할 수있는 방법을 제공합니다.


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Add VOI as a Preferred Source
Follow VOI news updates across Google.
+