Amazon Nova Pro 1.0은 AWS가 2024년 12월 re:Invent에서 공개한 자체 개발 멀티모달 파운데이션 모델이다. Amazon Bedrock을 통해서만 접근 가능하며, Nova 패밀리(Micro, Lite, Pro, Premier) 중 성능과 비용의 균형점에 위치한 중간급 모델이다.

주요 특징

Nova Pro의 가장 뚜렷한 차별점은 가격이다. 입력 $0.80, 출력$ 3.20/1M 토큰으로, GPT-4o( $2.50/$ 10.00)보다 3배 이상 저렴하고 Claude 3.5 Sonnet( $3.00/$ 15.00)과 비교하면 약 77% 비용 절감이 가능하다. Simon Willison은 Nova Pro가 "Claude 3.5 Haiku와 비슷한 가격대"라고 평가했고, 실제로 자신의 67,771장 사진 라이브러리 전체를 Nova Micro로 처리하는 비용이 $9.21에 불과하다고 계산했다(출처: simonwillison.net).

300K 토큰 컨텍스트 윈도우는 A4 약 450페이지에 해당하며, GPT-4o(128K)나 Claude 3.5 Sonnet(200K)보다 넓다. 텍스트, 이미지, 비디오 입력을 모두 처리하는 멀티모달 모델이지만, Gemini와 달리 오디오 입력은 지원하지 않는다. 200개 이상의 언어를 지원하며 한국어를 포함한 15개 언어에 대해 최적화되어 있다.

AWS 생태계와의 네이티브 통합이 또 다른 강점이다. Bedrock Knowledge Bases, Agents, Guardrails와 바로 연동되므로, AWS를 이미 사용 중인 기업이라면 별도 오케스트레이션 레이어 없이 RAG 파이프라인이나 에이전트 워크플로우를 구축할 수 있다. Function Calling도 지원하며 BFCL 벤치마크에서 68.4%를 기록했다.

Amazon Nova Pro 1.0 핵심 역량

할 수 있는 것

Nova Pro는 문서 분석에서 특히 강력한 성능을 보여준다. DocVQA 93.5%, ChartQA 89.2%로, 실제 사용자 테스트에서도 PDF 업로드 후 요약이나 의사결정 트리 생성 같은 구조화된 출력에서 좋은 결과를 보였다(출처: Quantum AI Labs 리뷰). 비디오 분석에서도 "기대를 훨씬 뛰어넘는" 결과를 냈다는 후기가 있는데, 영상 속 고양이 세 마리를 정확히 식별하고 동선까지 추적했다고 한다.

다만 한계도 분명하다. Simon Willison의 테스트에서 SVG 생성 성능은 "형편없었고", 9페이지짜리 PDF의 표를 변환할 때 일부 내용이 누락되는 문제가 발견됐다. 또한 비디오 이해 능력은 Gemini에 비해 "상당히 제한적"이라는 평가를 받았다. 한 블로그 리뷰어는 Nova의 인용 품질에 대해 불만을 표했는데, 크루아상 칼로리를 질문했을 때 세 개의 인용 중 하나가 "크루통"에 관한 전혀 관련 없는 소스였다고 한다(출처: tremendous.blog).

한국어 커뮤니티에서는 Nova Pro의 한국어 응답이 "AI스러운" 느낌이 강하다는 평가가 있었으며, GPT 모델이 더 자연스러운 한국어를 구사한다는 비교 의견이 있었다(출처: arca.live 커뮤니티).

번역 성능은 꽤 괜찮은 편으로, 영어-한국어 번역에서 COMET22 점수 약 0.89를 기록했다(출처: llm-stats.com).

성능

LLM 핵심 벤치마크에서 Nova Pro는 중간급 성능을 보여준다.

벤치마크	Nova Pro	GPT-4o	Claude 3.5 Sonnet
MMLU	85.9%	88.7%	88.3%
GPQA	46.9%	53.6%	65.0%
MATH Lvl 5	76.6%	76.6%	78.3%
IFEval	92.1%	87.9%	88.0%
HumanEval	89.0%	90.2%	92.0%

(출처: Amazon Nova Technical Report, 각 모델 공식 발표)

IFEval 92.1%는 GPT-4o(87.9%)와 Claude 3.5 Sonnet(88.0%)을 모두 앞서는 수치로, 지시 따르기(instruction following) 능력에서는 확실한 강점을 보인다. 반면 GPQA 46.9%는 Claude 3.5 Sonnet(65.0%)에 크게 뒤지며, 대학원 수준의 과학 추론에서는 한계가 있다.

멀티모달 벤치마크에서는 DocVQA 93.5%, ChartQA 89.2%로 문서/차트 이해에서 강점을 보이지만, MMMU 61.7%로 종합적인 멀티모달 추론에서는 플래그십 모델들에 비해 뒤진다(출처: Amazon Nova Technical Report).

Artificial Analysis Intelligence Index에서 65개 모델 중 52위(점수 13/65)를 기록했다. "가장 지능적인 모델은 아니지만, 유사 가격대의 비추론 모델과 비교하면 적절한 가격"이라는 평가다(출처: artificialanalysis.ai).

실사용 체감으로는, 벤치마크 수치보다 나은 부분과 못한 부분이 동시에 존재한다. 문서 분석과 지시 따르기에서는 벤치마크만큼 안정적이지만, 복잡한 추론이 필요한 작업에서는 GPT-4o나 Claude에 비해 확실히 부족하다는 것이 다수 사용자의 의견이다. 출력 속도는 약 115 tokens/sec로 준수한 편이다.

Amazon Nova Pro 1.0 벤치마크 성능 비교

사용 방법

Nova Pro는 Amazon Bedrock을 통해서만 접근할 수 있다. AWS 콘솔에서 Amazon Bedrock 서비스로 이동한 뒤, Model Access에서 Nova Pro를 활성화하면 된다. API로 사용할 때는 AWS SDK(boto3 등)를 통해 Bedrock Runtime 엔드포인트를 호출하는 방식이다.

Simon Willison은 API 접근까지 17단계가 필요하다며 AWS 온보딩 복잡도를 비판했다(출처: simonwillison.net). 일반 사용자가 ChatGPT나 Claude처럼 웹 인터페이스에서 바로 사용하는 것은 불가능하며, AWS 계정과 Bedrock 설정이 필수다.

개발자의 경우 Bedrock의 Converse API를 통해 멀티모달 입력(텍스트+이미지+비디오)을 하나의 API 호출로 처리할 수 있으며, Amazon Bedrock Agents를 활용하면 복잡한 에이전트 워크플로우도 구축 가능하다.

공식 문서: https://docs.aws.amazon.com/nova/latest/userguide/what-is-nova.html

가격

Nova Pro의 API 가격은 입력 $0.80/1M 토큰, 출력$ 3.20/1M 토큰이다. AWS 공식 페이지에서는 "동급 지능 클래스에서 Amazon Bedrock 내 최고 성능 모델 대비 75% 이상 저렴"하다고 표현한다.

경쟁 모델과 비교하면 확실히 저렴하다. Blended Rate(3:1 입출력 비율 기준) $1.40/1M 토큰은 GPT-4o의 약$ 5.38이나 Claude 3.5 Sonnet의 약 $6.00에 비해 73-77% 절감 효과가 있다. 대량 처리에서 이 차이는 상당하다.

다만 AWS Bedrock 요금 체계가 1,000 토큰 단위로 표시되어, 다른 API들의 1M 토큰 기준과 비교하기 번거롭다는 지적도 있다.

한국어 토큰 효율에 대한 별도 공개 데이터는 없다. 다만 한국어가 15개 최적화 언어에 포함되어 있으므로, 일반적인 비최적화 모델보다는 나은 토큰 효율을 기대할 수 있다.

무료 티어는 별도로 없으며, Bedrock의 프리 티어 내에서 제한적으로 체험할 수 있다. 별도 구독 요금 없이 종량제(pay-per-use)로만 과금된다.

Amazon Nova Pro 1.0 가격 비교

기술 사양

항목	사양
Provider	Amazon (AWS)
출시일	2024년 12월 5일
모델 유형	멀티모달 (텍스트+이미지+비디오 입력, 텍스트 출력)
컨텍스트 윈도우	300,000 tokens
최대 출력	5,000 tokens
파라미터 수	미공개
아키텍처	미공개 (Proprietary)
학습 마감일	2024년 10월 31일
지원 언어	200+ (15개 최적화: 영어, 한국어, 일본어, 중국어 등)
라이선스	Proprietary
접근 방법	Amazon Bedrock (API 전용)
Function Calling	지원 (BFCL 68.4%)
오디오 입력	미지원
디지털 워터마크	생성 콘텐츠에 자동 적용