오늘의 한줄
오늘은 AI가 더 빠르고, 더 오래 일하고, 더 깊게 기업 시스템 안으로 들어가는 흐름이 두드러졌습니다. 동시에 한국의 소버린 AI 투자, 에이전트 통제 플랫폼, 인프라 최적화 경쟁까지 겹치며 기술 경쟁의 무게중심이 모델 자체에서 운영과 배치로 이동하고 있습니다.
🤖Artificial Intelligence6
OpenAI는 어떻게 대규모 저지연 음성 AI를 구현했나
OpenAI는 실시간 음성 대화를 위해 WebRTC 스택을 다시 설계하고, 낮은 지연 시간과 자연스러운 턴테이킹, 글로벌 확장성을 동시에 확보한 방법을 공개했습니다. 음성 인터페이스의 경쟁력은 이제 모델 품질만이 아니라 네트워크·미디어 처리·세션 운영까지 포함한 시스템 엔지니어링에서 갈리고 있다는 점을 보여줍니다. 한국의 AI 서비스팀에도 '좋은 음성 UX는 모델만으로 안 된다'는 현실적인 기준을 던지는 사례입니다.
OpenAI o1, 응급실 초기 진단에서 의사보다 높은 정확도
하버드 연구에 따르면 OpenAI의 추론 모델 o1은 보스턴 병원 응급실 환자 76명의 전자의무기록을 바탕으로 한 초기 분류 진단에서 67% 정확도를 기록했습니다. 같은 과제에서 분류 의사는 50~55% 수준을 보였고, LLM이 임상 추론 벤치마크의 상당수를 넘어섰다는 평가도 나왔습니다. 아직 실제 의료 적용에는 검증과 책임 문제가 남아 있지만, 의료 AI가 단순 문서 요약을 넘어 의사결정 보조 영역으로 빠르게 이동 중이라는 점은 분명합니다.
장기 실행 에이전트 시대, 며칠씩 일하는 AI는 무엇이 다른가
이 글은 AI 에이전트가 단일 채팅 세션을 넘어 수일~수주 동안 자율적으로 실행될 때 필요한 설계 원칙을 정리합니다. 여러 컨텍스트 윈도우와 샌드박스를 넘나들고, 실패에서 복구하며, 중단 지점부터 다시 시작하는 능력이 핵심이며 기존 단발성 에이전트의 한계도 함께 짚습니다. 한국 개발팀에게도 에이전트의 경쟁 포인트가 '한 번 똑똑하게 답하는 것'에서 '오래 안정적으로 일하는 것'으로 바뀌고 있음을 보여줍니다.
DeepClaude, Claude Code 루프를 최대 17배 저렴하게
DeepClaude는 Claude Code CLI의 도구 호출, 파일 편집, bash, git 흐름은 그대로 유지하면서 API 백엔드만 DeepSeek V4 Pro나 OpenRouter, Fireworks AI 등으로 바꿔주는 프로젝트입니다. 월 200달러 요금과 사용량 제한이 있는 Claude Code와 비교해, 동일한 에이전트 루프를 최대 17배 저렴하게 돌릴 수 있다는 점이 핵심입니다. 에이전트 시대에는 모델 성능뿐 아니라 '도구 체인은 유지하고 추론 비용만 낮추는' 교체 가능성이 개발 생산성의 중요한 변수로 떠오르고 있습니다.
Gemento: 작은 로컬 LLM의 장기 작업 능력을 실험하는 하네스
Gemento는 작은 로컬 LLM이 긴 작업을 얼마나 버틸 수 있는지, 외부 상태·도구·역할 분리·루프 설계로 어디까지 보강할 수 있는지를 실험하는 오픈소스 하네스입니다. 새 모델 아키텍처를 주장하기보다, 4B급 모델도 시스템 설계를 잘하면 더 긴 작업을 수행할 수 있는지 검증하는 데 초점을 맞춥니다. GPU 자원이 제한된 팀에게는 '더 큰 모델'이 아니라 '더 나은 오케스트레이션'이 현실적인 대안이 될 수 있다는 점에서 흥미롭습니다.
Codex CLI에 목표 기반 자동 반복 기능 /goal 추가
Codex CLI 0.128.0 버전에 목표 기반 자동 반복 실행 기능인 /goal이 추가됐습니다. Ralph loop 개념을 적용해, 에이전트가 목표 달성 여부를 스스로 평가하면서 완료될 때까지 자율적으로 루프를 반복하는 방식입니다. 코딩 에이전트가 이제 단순 보조 도구를 넘어 장기 작업을 수행하는 작업자 형태로 진화하고 있다는 점에서 주목할 만합니다.
🏢Big Tech1
마이크로소프트, 그림자 AI 대응 위해 Agent 365 정식 출시
마이크로소프트는 AI 에이전트 관리 플랫폼 Agent 365를 프리뷰에서 정식 출시로 전환하며, 자율형 AI의 거버넌스 문제가 더 이상 이론이 아니라 운영상의 긴급 과제라고 선언했습니다. 이 플랫폼은 마이크로소프트 생태계뿐 아니라 AWS Bedrock, Google Cloud, 직원 단말, 각종 SaaS 에이전트까지 아우르는 통합 제어 평면을 지향합니다. 기업 입장에서는 생성형 AI 도입 다음 단계가 '누가 어떤 에이전트를 어디서 돌리는지 보이는 상태'를 만드는 일이라는 점을 분명히 보여줍니다.
🚀Startups2
Sierra, 기업용 AI 경쟁 속 9억5000만 달러 조달
기업용 AI 스타트업 Sierra가 9억5,000만달러를 유치하며, 총 가용 자금이 10억달러를 넘어섰습니다. 회사는 이 자금을 AI 기반 고객 경험의 '글로벌 표준'이 되는 데 쓰겠다고 밝혔습니다. 자본이 대규모로 몰린다는 것은 이제 엔터프라이즈 AI가 실험 단계를 지나 고객지원·운영 자동화 같은 핵심 업무 시스템의 주도권 경쟁으로 들어섰다는 의미입니다.
세레브라스, 최대 35억 달러 규모 IPO 추진
AI 칩 스타트업 Cerebras Systems는 주당 115~125달러에 2,800만 주를 공모하는 상장을 추진 중이며, 상단 기준 최대 35억달러를 조달할 수 있습니다. 대규모 자금 조달이 성사되면 엔비디아 중심의 AI 하드웨어 시장에서 대안 플레이어가 공격적으로 확장할 발판을 얻게 됩니다. 인프라 병목이 계속되는 상황에서, 칩 스타트업의 자본력은 단순 재무 이벤트가 아니라 생태계 경쟁력과 직결됩니다.
🛠️Developer Tools8
Gemini API, 장기 실행 작업용 웹훅으로 지연과 운영 부담 줄인다
Google은 Gemini API에 이벤트 기반 웹훅을 도입해, 오래 걸리는 작업의 완료 여부를 확인하려고 반복적으로 폴링하던 비효율을 줄이겠다고 밝혔습니다. 푸시 기반 알림 구조는 응답 지연과 인프라 낭비를 동시에 낮추고, 에이전트나 비동기 워크플로를 훨씬 안정적으로 운영하게 해줍니다. AI 기능이 실서비스 백엔드로 들어갈수록 이런 '개발자 경험' 개선이 실제 비용과 제품 완성도를 좌우하게 됩니다.
알리바바, 호퍼 GPU 추론 속도 3배 높이는 플래시QLA 공개
알리바바는 엔비디아 호퍼(Hopper) GPU에서 최대 3배 속도 향상을 낼 수 있는 고성능 선형 어텐션 커널 라이브러리 '플래시QLA(FlashQLA)'를 공개했고, 코드는 깃허브에 오픈소스로 배포했습니다. 경쟁이 모델 구조를 넘어 GPU 커널 같은 저수준 최적화 영역으로 내려오고 있다는 점이 핵심입니다. 같은 하드웨어로 더 많은 추론을 처리할 수 있다면, 한국 기업 입장에서도 GPU 확보만큼이나 소프트웨어 최적화 역량이 중요해집니다.
Linux 7.0은 왜 PostgreSQL 성능을 망가뜨렸나
Linux 7.0에서 기본 선점 모드였던 PREEMPT_NONE이 제거되면서, PostgreSQL 처리량이 같은 하드웨어에서 절반 수준으로 떨어지는 성능 회귀가 보고됐습니다. AWS 엔지니어가 96-vCPU Graviton4 머신에서 pgbench를 돌린 결과 Linux 6.x 대비 초당 트랜잭션이 크게 감소한 것으로 나타났습니다. OS 기본값 하나가 데이터베이스 성능을 무너뜨릴 수 있다는 점에서, 인프라 업그레이드는 반드시 워크로드 기준 벤치마크와 함께 진행해야 한다는 교훈을 줍니다.
에이전트 AI 시대, RAG 다음은 컴파일 단계 지식 계층
VentureBeat는 에이전트형 AI가 확산되면서 기존 'RAG + 벡터DB' 파이프라인만으로는 부족해지고, 문맥을 미리 구조화하는 새로운 지식 계층이 필요해지고 있다고 분석했습니다. Q1 2026 Pulse 설문에서는 독립형 벡터 데이터베이스의 채택 비중이 줄고, 하이브리드 검색 전략은 33.3%까지 늘며 가장 빠르게 성장했습니다. Pinecone이 새로 발표한 Nexus와 'context compiler'는, 앞으로 기업 데이터 활용 경쟁이 단순 검색이 아니라 작업 맥락을 얼마나 잘 준비하느냐로 옮겨갈 수 있음을 시사합니다.
AMD, 리눅스에 HDMI 2.1 지원 추가… 스팀 머신에도 호재
AMD가 리눅스에서 HDMI 2.1 지원을 확대하며, 우선 Fixed Rate Link(FRL)를 추가하고 Display Stream Compression(DSC)도 곧 지원할 예정입니다. 이는 고해상도·고주사율 출력이 필요한 리눅스 게이밍과 거실형 PC 환경에 특히 반가운 소식입니다. AI 인프라 뉴스에 가려지기 쉽지만, 리눅스 데스크톱과 게임 생태계의 완성도도 하드웨어 업체의 드라이버 투자에 크게 좌우된다는 점을 보여줍니다.
수백만 줄의 Haskell로 운영되는 Mercury의 프로덕션 엔지니어링
핀테크 기업 Mercury는 주석 등을 제외한 약 200만 줄의 Haskell 코드베이스로 30만 개 이상 기업 고객에게 뱅킹 서비스를 제공하고 있습니다. 2025년에는 2,480억달러 거래량과 연환산 매출 6억5,000만달러를 처리했으며, Haskell의 가치는 언어의 순수성 자체보다 운영 지식을 타입과 API에 녹여내는 데 있다고 설명합니다. 대규모 금융 시스템에서 정적 보장과 설계 일관성이 얼마나 큰 힘을 발휘하는지 보여주는 사례입니다.
cargo-chronoscope: Rust 빌드 성능을 추적하는 옵저버 도구
cargo-chronoscope은 cargo의 JSON 이벤트 스트림을 수집해 모든 빌드를 로컬 SQLite DB에 기록하고, TUI와 GitHub Action으로 빌드 성능 변화를 추적할 수 있게 해주는 도구입니다. PR마다 조금씩 늘어나는 Rust 빌드 시간을 어느 변경이 유발했는지 찾기 어렵다는 실무 문제를 정면으로 다룹니다. 개발 생산성이 곧 비용인 팀이라면, 이런 '관측 가능한 빌드 시스템'이 체감 성능 개선만큼 중요해지고 있습니다.
pgBackRest 유지보수 중단, 이제 PostgreSQL 백업은 어떻게 하나
PostgreSQL 백업 도구 pgBackRest의 단독 유지보수자 David Steele이 모든 작업 중단을 선언하면서, 유지보수와 버그 수정, PR 리뷰, 신규 기능 개발이 사실상 멈추게 됐습니다. 널리 쓰이던 핵심 인프라 도구가 단일 유지보수자에게 의존해왔다는 점이 드러난 셈입니다. 오픈소스 의존도가 높은 팀이라면 지금 필요한 건 기능 비교보다도, 백업·복구 체인의 지속 가능성과 대체 전략을 점검하는 일입니다.
🇰🇷Korea Tech1
국민성장펀드, 업스테이지에 5600억 투자… 소버린 AI 승부수
국민성장펀드가 '소버린 AI 확보를 위한 차세대 AI 모델 개발' 사업의 일환으로 업스테이지에 총 5,600억원 직접 투자를 승인했습니다. 자금은 첨단전략산업기금 1,000억원, 산업은행 300억원에 더해 SK네트웍스, 사제파트너스, 우리벤처파트너스, 미래에셋 등 민간 자금이 함께 들어가는 구조입니다. 리벨리온에 이은 두 번째 직접 투자 사례라는 점에서, 한국이 자체 모델 역량을 전략 산업으로 보고 본격적으로 자본을 투입하기 시작했다는 신호로 읽힙니다.