테크 CEO들 “AI가 코드를 쓰는 시대” 주장…현장 개발자들은 ‘회의적’
[서울=뉴스닻] 최승림 기자 = 글로벌 빅테크 수장들이 인공지능(AI)의 코딩 능력을 두고 잇단 장밋빛 전망을 내놓고 있다. 다리오 아모데이(Dario Amodei) 앤트로픽(Anthropic) CEO는 지난 3월 “3~6개월 안에 AI가 코드의 90%를 쓰는 수준에 도달할 것”이라고 했고, 마크 저커버그(Mark Zuckerberg) 메타 CEO도 4월 “내년 중 한 프로젝트에서 개발의 절반가량을 AI가 담당할 수 있다”고 말했다. 아마존·구글·마이크로소프트 등도 대규모언어모델(LLM)의 코드 생성 능력을 부각하고 있다.
그러나 실제 현장 개발자들은 “효율이 업무·숙련도·과제 성격에 따라 크게 갈린다”며 신중론을 내놓고 있다.

소프트웨어 엔지니어 콜튼 보에지(Colton Voege)는 업무에 AI를 도입해 본 결과 “한 번 쓰고 버릴 소규모 도구 작성엔 뛰어나지만 장기 효율 향상은 체감하지 못했다”고 말했다. 인터뷰들에 따르면 일부 개발자는 동료가 생성한 AI 코드 ‘뒷수습’을 해야 했다고 토로했고, AI 활용을 전제로 한 ‘보여주기식’ 과제를 떠안는 압박도 있다고 전했다.

앤트로픽의 ‘클로드 코드(Claude Code)’를 총괄하는 보리스 체르니(Boris Cherny)는 “대부분 코드를 클로드 코드가 쓴다”고 말하면서도 “정확한 비율을 제시할 과학적 근거를 마련 중”이라고 했다. 그는 “모든 코드는 엔지니어가 리뷰해야 한다”고 강조했다. 에이전트(agents) 기능처럼 테스트·수정까지 자동화된 시도도 있지만, “테스트 루프에 빠지는 ‘데스 스파이럴’” 같은 실패 사례도 존재한다는 지적이다.

오픈소스 생태계에서 활동하는 연구자 사이먼 윌리슨(Simon Willison)은 “AI가 높은 비율의 코드를 작성하는 것은 가능하겠지만, 그 과정엔 지금과 같거나 더 많은 사람이 관여할 것”이라고 말했다. 그는 숙련 개발자가 적절한 과제에 쓰면 “2~5배 생산성 향상”도 가능하지만, 이는 작업 유형과 전문성에 크게 의존한다고 했다.

AI 평가 비영리단체 METR의 한 실험에선 LLM을 쓴 숙련 오픈소스 엔지니어가 오히려 19% 더 오래 걸린 결과가 나왔다. 덴마크 전국 설문조사에서는 소프트웨어 엔지니어가 AI를 통해 평균 6.5%의 시간 절감 효과를 보고했는데, 11개 직군 중 가장 높았지만 “연간 생산성 증가율로 보면 의미는 있으나 폭발적이지는 않다”고 공동 연구자인 안데르스 훔룸(Anders Humlum)은 평가했다.

한 아마존 엔지니어는 “복잡한 프로젝트를 AI로 단기간에 끝내려다 ‘엉킨 코드 덩어리’가 됐다”며 전통적 방식으로 재구현 중이라고 밝혔다. 연구자들은 필요 여부와 무관한 AI 남용이 동료의 일을 늘리는 현상을 ‘워크슬롭(workslop)’이라 명명했다. 반면 아마존 대변인 톰 파넬(Tom Parnell)은 “사내 AI 도구가 더 빠르고 안전한 코드를 배포하게 돕고, 엔지니어 설문에서도 시간 절감과 생산성 향상을 보고한다”며 의무 사용은 아니다라고 밝혔다.

업계에선 AI 도입이 주니어 개발자 채용 축소로 이어져 장기적으로 ‘감독할 사람’이 사라질 수 있다는 우려도 제기된다. 대형 모델이 소비하는 전력과 인간 창작물 의존성, 최근 능력 개선의 정체감도 논쟁거리다. 일부 기업에선 AI 활용을 전제로 ‘5배 생산성’ 같은 내부 목표를 제시하거나, AI 코딩툴 사용이 부족하다는 이유로 해고 사례가 나왔다는 보도도 있었다.

현장의 공통분모는 명확하다. AI는 반복 작업·프로토타입·저위험 과제에서 특히 유용하지만, 요구사항 정의·설계·품질관리·책임 있는 배포는 여전히 인간의 몫이다. 윌리슨은 “우리의 일은 코드를 타이핑하는 게 아니라, 문제를 해결하는 시스템을 전달하는 것”이라고 말했다.
AI 코딩이 업무 방식을 바꾸고 있는 것은 분명하지만, 그것이 곧바로 ‘완전 자동화’로 이어진다는 보장은 없다. 결국 핵심은 적재적소의 활용과 사람 중심의 검증 체계라는 데 무게가 실리고 있다.
[저작권자 ⓒ 뉴스닻. 무단전재·재배포 금지]
최승림 기자 (seunglim.choi@newsdot.net)