오늘의 한줄

오늘은 AI가 더 똑똑해지는 방식과, 그 AI를 돌리기 위한 인프라 경쟁, 그리고 보안·책임 문제까지 한 번에 드러난 날이었습니다. 모델 성능 향상만큼이나 배포 구조, 법적 리스크, 운영 도구의 중요성이 더 커지고 있습니다.

🤖Artificial Intelligence6

어드바이저 전략으로 Sonnet 성능 끌어올리기

Claude Platform에 공식 도입된 ‘어드바이저 전략’은 Opus를 조언자, Sonnet이나 Haiku를 실행자로 조합해 비용은 낮추면서 고급 추론 성능을 끌어올리는 패턴입니다. Sonnet이 단독으로 작업할 때보다 Opus 어드바이저를 붙였을 때 SWE 계열 작업 성능이 개선되는 사례가 제시됐고, 기업 입장에선 최고급 모델을 항상 직접 호출하지 않고도 에이전트 품질을 높일 수 있다는 점이 중요합니다.

알리바바 새 영상 생성 모델, 글로벌 랭킹 1위

알리바바의 새 영상 생성 모델 ‘HappyHorse 1.0’이 공개 직후 글로벌 성능 랭킹 선두에 올랐습니다. 텍스트와 이미지 생성에 이어 비디오 생성까지 중국 빅테크가 존재감을 키우면서, 멀티모달 경쟁이 미국 중심에서 빠르게 다극화되고 있다는 점이 주목할 만합니다.

메타의 새 헬스 AI, 민감정보는 요구하고 조언은 부실했다

Meta의 Muse Spark는 검사 결과 같은 원시 건강 데이터를 입력받아 분석을 제안하지만, 실제 조언 품질은 의료 전문가를 대체하기엔 한참 부족하다는 평가를 받았습니다. 개인정보 민감도가 가장 높은 헬스케어 영역에서 ‘데이터 수집 능력’과 ‘판단 신뢰성’은 별개라는 점을 분명히 보여주는 사례입니다.

27년 묵은 취약점까지 찾은 AI, 보안팀의 탐지 방식이 바뀐다

Anthropic의 Claude Mythos Preview는 OpenBSD TCP 스택에 27년간 숨어 있던 버그를 자율적으로 찾아냈고, 해당 발견을 이끈 모델 실행 비용은 50달러 미만이었다고 합니다. Firefox 147 익스플로잇 작성에서 181회 성공해 Claude Opus 4.6의 2회를 크게 앞섰고, SWE-bench Pro 77.8%, CyberGym 83.1%를 기록해 보안 탐지와 공격 재현의 기준선을 한 단계 끌어올렸습니다.

ChatGPT 스킬로 반복 업무 자동화하기

OpenAI는 ChatGPT 스킬을 통해 재사용 가능한 워크플로를 만들고, 반복 업무를 자동화하며, 일관된 고품질 결과를 얻는 방법을 소개했습니다. 개인 생산성 팁처럼 보이지만, 실제로는 팀 단위 업무를 표준화하고 프롬프트 노하우를 자산화하는 운영 방식의 변화로 이어질 수 있습니다.

ChatGPT로 검색·딥리서치 활용하기

OpenAI는 ChatGPT의 검색과 딥리서치 기능을 활용해 최신 정보를 찾고, 출처를 분석하며, 구조화된 인사이트를 만드는 방법을 소개했습니다. 단순 질의응답을 넘어 리서치 워크플로 전체를 AI에 맡기는 방향이 구체화되면서, 지식 노동의 기본 도구가 검색창에서 에이전트로 이동하고 있습니다.

🏢Big Tech2

구글·인텔, AI 인프라 협력 강화

Google과 Intel은 전 세계적인 CPU 수요 증가와 공급 압박 속에서 맞춤형 칩 공동 개발을 포함한 AI 인프라 협력을 확대하고 있습니다. AI 경쟁이 더 이상 모델만의 싸움이 아니라 칩 설계, 공급망, 데이터센터 운영까지 묶인 종합전이 됐다는 점을 잘 보여줍니다.

OpenAI, AI 연구소 책임 범위 제한 법안 지지

OpenAI는 일리노이주에서 AI 연구소가 언제 법적 책임을 지는지 제한하는 법안을 지지하고 있습니다. 생성형 AI가 사회 전반에 퍼질수록 기술 경쟁 못지않게 책임 소재와 면책 범위를 둘러싼 법제화가 중요해지고 있어, 한국 기업도 제품 설계 단계부터 규제 시나리오를 함께 봐야 할 시점입니다.

🚀Startups1

코어위브·앤트로픽, AI 클라우드 파트너십 체결

CoreWeave와 Anthropic이 새로운 계약을 맺고, CoreWeave의 클라우드 인프라에서 Claude 모델 운영을 지원하기로 했습니다. GPU 인프라를 안정적으로 확보하는 것이 곧 모델 경쟁력으로 이어지는 시장에서, 모델 기업과 클라우드 사업자의 결합이 더 긴밀해지고 있다는 신호로 읽힙니다.

🛠️Developer Tools6

오픈소스 AI 해커 ‘strix’, 취약점 찾고 수정까지

strix는 실제 해커처럼 코드를 실행하고 취약점을 찾은 뒤 PoC로 검증까지 수행하는 자율형 오픈소스 보안 테스트 도구입니다. CI/CD 파이프라인과 GitHub Actions에 붙여 PR마다 자동 스캔이 가능해, 보안 점검이 연말 감사성 이벤트가 아니라 개발 흐름 안으로 들어온다는 점에서 실무 가치가 큽니다.

Shopify AI Toolkit으로 스토어 운영 자동화하기

Shopify AI Toolkit은 문서, API 스키마, 코드 검증 기능을 AI 에이전트에 연결해 스토어 구축과 운영을 자연어로 처리할 수 있게 해줍니다. 예를 들어 상품 SEO 최적화나 전체 상품 15% 할인 같은 작업을 한 번에 실행할 수 있어, 커머스 운영이 점점 ‘관리 화면 클릭’에서 ‘에이전트 지시’로 바뀌고 있음을 보여줍니다.

개발자를 위한 사용자 공간 USB 드라이버 입문

이 글은 USB 드라이버 개발이 꼭 커널 영역의 고난도 작업만은 아니며, libusb를 활용하면 사용자 공간에서도 장치 열거, 제어 전송, 데이터 송수신을 구현할 수 있다고 설명합니다. 하드웨어 제어의 진입장벽이 생각보다 낮다는 점은 임베디드, 보안, 디바이스 자동화 업무를 하는 개발자에게 꽤 실용적인 시사점을 줍니다.

실제 쇼핑몰을 SQLite로 운영하며 얻은 교훈

AI 에이전트가 상품 디자인부터 주문 처리, 블로그 작성까지 맡는 쇼핑몰 ultrathink.art를 Stripe 결제까지 포함한 프로덕션 환경에서 SQLite로 운영한 경험을 공유한 글입니다. 파일 4개와 볼륨 1개 수준의 단순한 구성으로도 실제 서비스가 굴러간다는 점은, 초기 제품이나 소규모 SaaS에서 ‘무조건 복잡한 데이터베이스’가 정답은 아니라는 현실적인 메시지를 줍니다.

리눅스용 리틀 스니치, 앱 네트워크 연결을 한눈에

이 도구는 애플리케이션별 네트워크 연결을 시각화하고, 어떤 프로그램이 어떤 서버와 통신하는지 실시간 및 과거 기록으로 보여줍니다. 클릭 한 번으로 연결 차단과 데이터 사용량 추적이 가능해, 개발자와 보안 담당자 모두 엔드포인트 가시성을 손쉽게 확보할 수 있다는 점이 장점입니다.

브로드컴 여파로 VMware 고객 이탈 가속

Nutanix는 Broadcom에 대한 부정적 인식이 확산되면서 VMware 고객 3만 곳을 자사로 전환시켰다고 주장했습니다. 인프라 시장에서는 기술 우위만큼이나 가격 정책, 파트너 관계, 고객 경험이 중요하다는 점을 다시 보여주며, 기업 IT팀엔 벤더 종속 리스크를 재점검하라는 신호이기도 합니다.

🇰🇷Korea Tech2

SKT, Arm·리벨리온과 CPU+NPU AI 서버 개발

SK텔레콤은 Arm, 리벨리온과 함께 Arm의 ‘AGI CPU’와 리벨리온의 추론 특화 NPU ‘리벨카드’를 결합한 AI 서버를 공동 개발하기로 했습니다. CPU가 시스템 제어를 맡고 NPU가 추론 연산을 담당하는 이종 컴퓨팅 구조로 효율을 높이려는 전략인데, 한국도 AI 인프라를 단순 도입이 아니라 자체 조합과 최적화 경쟁으로 가져가려는 움직임이 뚜렷해졌습니다.

마이리얼트립, 파트너 API와 MCP 서버 공개

마이리얼트립이 누구나 바로 활용할 수 있는 파트너 API와 MCP 서버를 공개했고, 이 전환 과정에서 사업팀이 직접 Claude Code를 활용했다고 소개했습니다. 국내 서비스 기업도 개발 조직만이 아니라 비개발 부서까지 AI 도구를 이용해 플랫폼을 외부에 개방하는 흐름이 시작됐다는 점에서 의미가 큽니다.