꼬부기부 (211.♡.204.156)
2026년 6월 27일 PM 09:01
huggingface : https://huggingface.co/deepreinforce-ai/Ornith-1.0-35B-GGUF
공식문서 : https://deep-reinforce.com/ornith_1_0.html
한국블로그 소개 : https://javaexpert.tistory.com/1783
최첨단 코딩 에이전트 : 9B-Dense, 31B-Dense, 35B-MoE, 397B-MoE(Gemma 4 및 Qwen 3.5 기반 사후 학습) 버전으로 제공되며, Terminal-Bench 2.1, SWE-Bench, NL2Repo, OpenClaw와 같은 코딩 벤치마크에서 유사한 규모의 오픈 소스 모델 중 최고 수준의 성능을 달성합니다.
자체 개선 학습 프레임워크 : Ornith-1.0은 강화 학습(RL)을 활용하여 솔루션 도출 과정뿐만 아니라 해당 도출 과정을 이끄는 스캐폴드(scaffold)까지 학습합니다. 스캐폴드와 결과 솔루션을 동시에 최적화함으로써, 모델은 더 나은 탐색 경로를 발견하고 더 높은 품질의 솔루션을 생성합니다.

셀프 개선 한다는데 어떻게 적용되는지 이해가 잘 가지않고..
레딧형님들 리뷰로는 think 루프 돈다고 하네요.
Qwen3.5 기반 재학습이라 결국 또 다른 Qwen파생모델인 것 같습니다.
파생모델 써서 좋은 결과 얻은 적이 잘 없어서 별로 기대는 안되네요.
재미삼아 테스트 해보려구요.
댓글 (2)
-
Kkamziki
06.27 · 112.♡.3.91
-
알알랭드특급
00:28 · 84.♡.171.26
기본적인 터미널 명령어 처리만 잘해줘도 쓸 생각 있습니다!
댓글을 작성하려면 이 필요합니다.
Qwen3.6 27b 오리지널 벤치마크 결과와 비교해보면, 35b조차도 그리 결과가 좋지 않더라구요. 저도 써볼려다 말았습니다.