데일리 노트: 2025년에 주목해야 할 Software 트렌드

Transcend Borders: Software & Design

2024. 12. 9.

데일리 노트 뉴스레터

Be the one who understands engineering to know what's possible, design to know what's beautiful, psychology to know what's desirable, business to know what's valuable, and has the courage to act on it (@keshavchan)

About 데일리 노트

벌서 한 해의 끝에 다다르고 있습니다. 2024년을 마무리하고 2025년을 기다리며 이번 편은 디지털 크리에이터들이 주목해봐야할 2025년 트랜드: Software 편으로 내용을 준비해보았습니다. 다음주에는 주목해봐야할 2025년 트랜드: Design 편이 준비되어 있습니다.
다가오는 목요일에는'AI 아바타'와 관련된 주제로 테크잇슈 뉴스레터에 외부 연재하는 글이 기재됩니다. 이 또한 많은 관심 부탁드립니다.
그럼, 이번 데일리 노트도 재미있게 읽어나가시길 바라며, 다음주에는 12월 셋째 주 뉴스레터로 다시 찾아뵙겠습니다.

AI 음성 기반 서비스
능동적인 AI 에이전트 서비스
Software & Design 라이브러리

AI 음성 서비스

첫번째로 주목할 트랜드는 AI 음성 기반 서비스입니다. 여러 AI 서비스 중, 대중들이 활용하기 쉽고 재미있는 애플리케이션들이 나오고 있는 분야이며, 2025년에는 더욱더 많은 사람들이 음성(Voice)으로 AI와 상호작용 하는 것을 친숙하게 여길 것으로 봅니다. 과거에는 Elevenlabs, Udio Music 등 텍스트-to-음성 기반의 서비스만 출시되었던 반면, 최근에는 음성으로 컴퓨터 디바이스와 소통하는 음성-to-컴퓨터 제어 서비스들이 나타나는 모습입니다.

산타와 대화 나눠보기

출처: ElevenLabs

가장 대표적으로 Microsoft Copilot 애플리케이션은 “Copilot Vision” 기능을 출시하며 화면을 볼 수 있는 음성 어시스턴트를 소개했습니다. 사용자는 음성 어시스턴트와의 대화하며 컴퓨터 작업을 수행할 수 있으며, 음성 어시스턴트는 화면 내에서 일어나는 상황에 대한 이해를 기반으로 출력 결과를 보여줍니다. 공식 데모 영상에서 사용자들은 음성 어시스턴트와 상호작용하며 여행 계획을 세우고, 쇼핑/게임을 하는 모습을 볼 수 있습니다.

Copilot Vision

출처: Microsoft Blog

해당 아이디어는 지난 5월에 OpenAI사가 공개한 고급 음성 모드의 “Live Vision" 기능의 데모와 작동방식이 유사하며, 대화만 가능하던 비서가 이제는 디바이스의 카메라를 통해 볼 수 있는 능력이 업그레이드 되었습니다.

GPT-4o Vision 라이브 데모

출처: Rowan Cheung

Nvidia, OpenAI 등 범용적인 AI 모델 개발사들뿐만 아니라, Elevenlabs, Hume AI 등 음성 AI 모델 개발사들이 개발 툴 킷들을 발표하며 API를 활용해 음성 AI 서비스를 애플리케이션 내 도입하는 경우가 증가할 것으로 보입니다.

Nvidia의 Fugatto: 텍스트/오디오 인풋으로 다양한 종류의 음악, 음성, 소리를 출력시키는 생성형 AI 음성 모델
OpenAI의 Realtime API: 자연스러운 Speech-to-Speech 대화 기능을 손쉽게 자체 서비스 안에 도입할 수 있는 API
Elevenlabs의 Conversational AI: 대화형 AI 에이전트를 구축할 수 있는 개발 플랫폼
Hume AI의 Voice Control: 다양한 음성 변조 방식을 통해 몇 초 만에 고유한 AI 음성 생성할 수 있는 기능

생성형 음성 AI 서비스의 마법은 기존의 텍스트 기반 창작품을 대화형으로 바뀔 수 있다는 데 있습니다. 글로써 창작품이 끝나는 것이 아니라, 이를 음반으로 바꿔보고, 팟캐스트로 만들어 보며 창착 환경이 무한히 확장 시킬 수 있게 되었습니다. 여러 가지 유형의 데이터 유형을 이해할 수 있는 멀티모달 음성 AI 서비스가 나타남에 따라 크리에이티브 창작품들도 다양한 형태를 가질 것으로 보입니다.

능동적인(Proactive) AI 에이전트 서비스

두 번째로 주목할 트랜드는 능동성이 강화된 AI 에이전트 서비스의 등장입니다. 과거의 AI 에이전트 서비스가 정해진 명령 구조에 따라 움직였다면, 앞으로의 AI 에이전트는 입력 프롬프트에 따른 출력 결과를 되짚어보고 능동적으로 행동을 보완해 나가는 형태로 나아갈 것입니다.

능동적인 AI 에이전트 서비스를 가장 먼저 선보인 서비스 분야는 AI 프로그래밍 툴입니다. 최초의 Agentic IDE라고 주장하는 Windsurf 플랫폼의 경우, 사용자가 코드를 입력하는 동안 사용자의 개발 의도를 예측하고 계획을 세워, (i) 자동 완성, (ii) 다단계 편집, (iii) Repository에 걸쳐 전반적인 편집 활동을 자체적으로 수행해 나갑니다.

AI 코드 편집기의 진화 과정
출처: Every

대표 AI 프로그래밍 도구인 Cursor도 v0.43 버전 업데이트를 통해 “Composer Agent”기능을 소개하며 능동적인 프로그래밍 에이전트의 모습을 일부 도입했습니다. 해당 에이전트를 통해 (i) 통합 템플릿 설계, (ii) 프로그래밍 코드의 즉각 수정/재배열, (iii) 프로젝트 셋업을 빠른 속도로 실행할 수 있게 되었습니다.

@hive_eco님은 Composer Agent를 활용해 두 에이전트가 공동 작업을 하는 모습과 스스로 명령을 내리는 에이전트의 모습을 선보이며, AI 프로그래밍의 자동화가 현재 어떤 수준까지 나아갈 수 있는 지를 보여줍니다.

두 에이전트가 공동 작업을 하고 있는 장면

출처: @hive_echo

가장 높은 자율성 정도를 보이며 많은 사람들이 주목하고 있는 능동적인 AI 에이전트 프로젝트는 H Company가 출시 예정인 “Runner H” 컴퓨터 제어 에이전트입니다. 원하는 목표를 프롬프트로 입력하면 Runner H 에이전트가 컴퓨터를 스스로 탐색해나가며 복잡하고, 다단계 작업을 마무리 할 수 있는 능력을 가졌기 때문입니다.

컴퓨터 제어 능력을 평가하는 WebVoyager 벤치마크에서 Claude사의 컴퓨터 제어 에이전트보다 개선된 평가 결과를 나온 것으로 알려졌으며, 픽셀 단위까지 웹 인터페이스를 탐색하며 UI 변경에도 자동적으로 적응해 나갈 수 있는 것으로 알려져 있습니다.

데모를 통해서 Runner H 에이전트가 (i) 웹 스크래핑, (ii) 수학 문제 해결, (iii) 실시간 데이터 수집, (iv) 지도 탐색 등을 수행하는 모습을 보여주며 다양한 목적에 걸쳐 자율적인 컴퓨터 에이전트가 활용 될 수 있음을 보였습니다. 현재 서비스가 출시된 상황은 아니며, 대기명단만 열려있는 상황입니다. 해당 서비스가 홍보한 만큼의 능동성을 보일 수 있는지는 지켜봐야 할 대목입니다.

웹 스크래핑 활동을 하는 Runner H와 Claude Computer Use 에이전트 바교

출처: Runner H

능동적인 AI 에이전트 서비스는 산업계와 연구계 모두에서 주목하고 있는 주제인 만큼, AI 프로그래밍 서비스를 필두로 2025년에는 능동적인 AI 에이전트들을 더 많이 찾아볼 수 있을거라 생각합니다. 이렇게 될 경우, AI 에이전트의 플로우를 기획하기 위한 툴 뿐만 아니라, AI 에이전트의 결과를 자동으로 평가(Evaluation)할 수 있는 서비스의 역할도 중요해질 것으로 보입니다.

출시/업데이트

Amazon: re:Invent 연례행사서 대형언어모델 노바(Nova) 시리즈 공개
Anthropic: Amazon Bedrock 서비스 위에서 Prompt Caching Preview 지원
Browser Company: Dia — 스마트 브라우저 출시
Cohere: Rerank 3.5 — 엔터프라이즈 데이터 추론 능력 및 다국어 기능 지원하는 최신 AI 검색 모델
Every: Extendable Articles — LLM 챗봇을 통해 자료의 출처를 문의할 수 있는 기사
Exa AI: Exa Websets — AI 애플리케이션을 위한 검색 API
Google: Chrome DevTools 내 AI 지원 | Google Deepmind — GenCast: 극한 날씨 상황을 예측할 수 있는 AI 모델 | Android OS 업데이트 — Expressive Captions: 언어/소리에 녹아 있는 뉘앙스를 캡션에 드러내는 기능
Hello Robot: Stretch AI — AI 가정용 로봇 애플리케이션을 구축할 수 있는 오픈 소스 도구, 가이드, 레퍼런스 코드
Hugging Face: LLaMA-O1 — 논리력(Reasoning) 모델 모음집 | Open-source AI: 2024년 리뷰 | FishSpeech v1.5 — 오픈소스 텍스트-스피치 모델
Humane: CosmOS — 연결된 IoS 디바이스를 위한 AI 운영 체제
Microsoft: Copilot Vision Preview: 화면을 보면서 컴퓨터 작업을 도와주는 어시스턴트 | MatterSimV1-1M, MatterSimV1-5M — 다양한 원소, 온도, 압력 등 재료의 특성을 시뮬레이션 하도록 설계된 딥런닝 모델
Mistral AI: LeChat 챗봇 내 파이썬 실행 가능
Notion: Action-packed Automations — Zapier 및 Make 등의 플랫폼을 통해 1000개 이상의 도구에 연결하여 데이터베이스 액션 트리거 설정 가능
Nous Research: Nous DisTrO와 하드웨어를 활용한 15B 파라미터 언어모델 사전 학습
Open AI: OpenAI o1 공식 버전 출시 | OpenAI Devs Page 복사해 IDE 내 최신 API 활용
Pleias: 오픈 데이터 기반으로 훈련된 모델군 — Pleias-3B, Pleias-1B, Pleias-350M
Qodo: Cover — 회귀 테스트를 진행하는 자율 AI 에이전트
Replit: 검증된 개발자와 매칭 될 수 있는 새로운 바운티 서비스 출시
Ruliad AI: DeepThought-8B — LLaMA-3.1 모델 기반으로 구축된 오픈소스 논리 모델
Sailor2: Qwen 2.5 모델 기초 위에 세워지고, 다국어 지원 대형언어모델(0.8B, 8B, 20B 파라미터)을 지원하는 커뮤니티 기반 프로젝트
Sakana AI — Cycle QD: 서로를 보완하는 전문 에이전트 무리, 평생 학습 토대를 마련하는 모델 통합 연구
Supabase: AI Assistant v2 — 새로운 기능(ex. Schema Design, Data Query & Charting 등)을 갖춘 v2 어시스턴트 출시 | Cron — DB 내에서 반복작업을 수행할 수 있는 Postgres 모듈
v0: Figma 디자인 Import 지원
World Labs: 공간 지능 연구 결과 공개 & 데모
ZenML: LLMOps Database — 300+개의 실제 LLM 실행 케이스로 채워진 데이터베이스

프로젝트/상품/서비스

BrowserQwen: 웹페이지/PDF 콘텐츠에 대해 Qwen과 맥락적 대화를 수행하는 Chrome Browser Extension
Portal: 기존 검색 + 답변 엔진의 장점을 결합한 새로운 오픈 소스 검색 엔진
@nekochan_html: v0/three.js를 활용한 웹게임 개발
@burkeholland: VS Code Copilot & 음성 만을 활용해 모바일 앱 게임 복제본 만들기

에세이/뉴스레터/보고서/논문

a16z: Big Ideas in Tech 2025 — 2025년을 빛낼 테크 아이디어 | “AI Inside” Opens New Markets for Vertical SaaS — AI를 활용한 VSaaS 시장에서의 기회
Explosion Blog: From PDFs to AI-ready structured data: a deep dive — PDF, Word 문서, 스캔 등을 사용하여 문서 이해 및 정보 추출 파이프라인을 구축하기 위한 워크플로우
Every Newsletter: AI Isn’t Your God—But It Might Be Your Intern — AI의 약속과 현실 사이의 괴리에 대한 관점
Foundation Capital Blog: How Systems of Agents will collapse the enterprise stack — 에이전트 시스템이 기업용 서비스에 가져올 변화
Google Cloud Blog: Measuring gen AI success: A deep dive into the KPIs you need — 생성형 AI의 효율성을 평가하기 위해 봐야 하는 KPI 지표
Ivan’s Blog: Are your eval improvements just pure chance? — 정확한 모델 결과 평가 가이드
Michael Saylor: Microsoft Bitcoin Strategy — Microsoft 이사진에게 전달한 비트코인 투자 필요성
Open AI Blog: Morgan Stanley AI Assistant 평가 프레임워크 구축 과정
Sorta Insightful Blog: Late Takes on OpenAI o1 — 논리력을 갖춘 o1 모델 군에 대한 생각
Amplifying human performance in combinatorial competitive programming — 경쟁력 있는 프로그래머를 의미 있게 도울 수 있는 AI 시스템
Boundless Socratic Learning with Language Games — 초기 학습 데이터를 뛰어넘어 자율적으로 능력을 향상하는 AI의 재귀적 자기 개선 접근 방식
Challenges in Human-Agent Communication — 인간과 AI 에이전트 간의 공통된 대화 지점을 찾아 나가기 위한 12가지 주요 과제
CodeTree: Agent-guided Tree Search for Code Generation with Large Language Models — LLM 에이전트들이 코드 생성 프로세스의 각 단계에서 검색 공간을 효율적으로 탐색할 수 있는 프레임워크
Diffusion Meets Flow Matching: Two Sides of the Same Coin — 디퓨전 모델과 가우시안 플로우 매칭을 상호 호환하여 활용할 수 있는 이유
DrugAgent: Automating AI-aided Drug Discovery Programming through LLM Multi-Agent Collaboration — 약물 발견을 위한 머신런닝 프로그래밍 자동화 프레임워크
MarS: A unified financial market simulation engine in the era of generative foundation models — 금융 산업에서 활용할 수 있는 생성형 AI 통합 솔루션 구축하기
Photonic processor could enable ultrafast AI computations with extreme energy efficiency — 전기 대신 빛을 사용해 칩에서 뉴럴 네트워크 연산을 수행할 수 있는 장치
Proactive Agent: Shifting LLM Agents from Reactive Responses to Active Assistance — 능동적인 에이전트 시스템 개발
Reverse Thinking Makes LLMs Stronger Reasoners — LLM에게 '역발상'을 훈련하면 상식, 수학 및 논리적 추론 작업에서 성과가 향상된 증명
Shaping AI's Impact on Billions of Lives — 실무자, 정책 입안자 및 기타 이해관계자가 AI의 장점을 극대화하고 단점을 최소화하기 위해 취할 수 있는 조치

가이드/튜토리얼

Hugging Face: smol-course — SmolLM2 모델 시리즈 기반으로 특정 사용 사례에 맞게 언어 모델을 활용하는 과정
LlamaIndex: 구글 드라이브 기반 LlamaCloud Pipeline 구축 방법
Lee Robinson: Understanding AI
SwirlAI Newsletter: AI 엔지니어링이 무엇인가요?
AWS Machine Learning Blog: Amazon Bedrock/Amazon Connect/Amazon Lex/LangChain/WhatsApp을 활용해 Chat 어시스턴트 만들기
@adithya_s_k: AI Engineering Academy — 한 개념씩 마스터 해보는 응용 AI
@cj_zZZz: AI 코딩 과정에서 올바른 문서화(Documentation) 방법
@kregenrek: Cursor/v0를 활용해 AI 앱 개발하기
@MervinPraison: Google AI 코드 편집기 Project IDX 활용 가이드

경험담/후기

@HamelHusain: 기술 문서 작성을 통한 잠재 고객 구축 (전략, 실수) | Voice-to-Content 방식 통해 Answer AI 블로그 작성한 후기
@petergyang: 비-엔지니어로서 AI 코딩하면서 느낀 점

팟캐스트/관점

AI & I Podcast w. Val Town CEO Steve — 1년 전 1시간 걸리던 앱 구축 코딩 작업을 1분 안에 완료하기
Around the Prompt Podcast w. Simon Willison — AI, 오픈 소스, 저널리즘의 교차점에서 데이터 저널리즘을 향상하는 데 있어 데이터 세트와 같은 도구의 중요성
Behind the Craft Podcast w. Zapier Cofounder Mike Knoop — Zapier의 작동 방식, PM과 마케터가 AI를 사용하여 더 많은 업무를 자동화하는 방법, LLM이 스스로 AGI에 도달하지 못하는 이유
Greg Isenberg Podcast w. Entrepreneur Jacky Chou — SEO와 키워드 리서치를 사용하여 비즈니스 그로스 해킹 전략/프레임워크 알아 오기
Latent Space Podcast w. Anthropic CEO Erik Schluntz — Claude 3.5 Sonnet, 컴퓨터 제어, 에이전트에 대해서
Lenny’s Podcast w. Google Ventures UX Research Partner Michael Margolis — 창업자가 '핵심 고객', 즉 초기에 제품을 채택할 가능성이 가장 높은 목표 시장의 특정 하위 고객군을 식별하기 위한 접근 방식
@carlyayres: The relationship graph — 콜드 이메일, 따뜻한 소개, 디자인 커리어를 만들어 나가는 방법
@ClementDelangue: 2025년 AI에 대한 6가지 예측과 2024년 예측 정확성 파악하기

출시/업데이트

Elevenlabs: Conversational AI — 대화형 AI 에이전트 구축 킷 | AI Santa — 산타와의 대화
Haiper 2.5: Enhanced Mode — Keyframe Conditioning Timeline을 활용해 프레임 커스터마이즈
Hume: Voice Control — 실험적인 음성 변조 방식을 통해 몇 초 만에 고유한 AI 음성 생성
Figma: 2024년 활동 리뷰 | 하나의 클릭으로 Figma Design을 Slide 형태로 만들 수 있는 업데이트 | 개발자 모드에서 주석을 생성하고 편집할 수 있는 플러그인 제작 기능
Freepik: Editorial Portraits — 초현실적인 클로즈업 또는 미디엄 샷에 적합한 인물 사진 기능 | Mockups — 몇 초 만에 생성되는 광고
Google Cloud: Veo — 이미지-비디오 모델, Imagen 3 — 텍스트-이미지 모델
Google Deepmind: Genie 2 — 무한히 다양한 액션 제어가 가능하고 게임 플레이가 가능한 3D 환경을 생성해주는 기초 월드 모델
Luma Labs: Luma Photon 텍스트-이미지 모델 — 창의적, 개인화 할 수 있 고화질 이미지 생성 모델
Meta: Haptics SDK & Interactive SDK — 더 많은 플랫폼 지원으로 몰입도와 참여도 높이기 | Horizon V71 — 플랫폼 지원 강화, 청구 SDK를 통한 Android 앱의 수익 창출, 안정성 및 보안 개선 | Reality Labs — 물리적 공간을 가상의 방탈출 방으로 바꾸는 내러티브 중심의 심리 스릴러 VR 게임 Shattered 출시
Microsoft Designer: 말들의 의미, 관계를 파악해 자동으로 글꼴의 스타일을 설정해주는 기능
Motion: Motion Cursor — 창의적인 커서 효과를 만들어내는 React 컴포넌트
NotebookLM & Spotify: Wrapped AI Podcast — 한 해 동안 좋아했던 트랙과 아티스트에 대한 진화 과정을 팟캐스트로 들어보기
Runway: Video keyframing prototype — 예술적 가능성 탐색 공간 | Pages With — 주요 아티스트의 이야기, 영감, 창작 철학을 탐구하는 새로운 잡지 시리즈
Tencent: HunyuanVideo — 데이터 큐레이션, 이미지-비디오 합동 모델 훈련, 대규모 모델 훈련 및 추론을 용이하게 하도록 설계된 효율적인 인프라 등을 특징으로 하는 오픈소스 도영상 기초 모델
XReal One Series: XREAL One AR 안경 & X1 칩

프로젝트

Adobe’s MultiFoley AI: 동영상 속 액션과 일치하는 사운드 생성, 간단한 텍스트 프롬프트를 사용하여 사운드를 조정
Aiuni AI: 정확한 움직임을 모방할 수 있는 3D 모델, 이미지에서 3D로 변환하는 AI
@80Level: 붓이 공중에서 나무 블록에 페인트하는 3D 시뮬레이션
@AleRVG: 감정적 도형 w. Luma Dream Machine — 끊임없는 확장, 충돌, 파편화되는 기하학적 도형의 춤을 통한 정서적 혼돈
@augmentedcamel: XR 브레인스토밍
@chrisfirsttt: Hailuo AI를 활용해 실제 영화 장면 뒤에 일어난 일 상상하기
@chris_venturaa: Apple Vision Pro를 활용한 Porsche의 자동차 내부 보여주기
@HBCoop_: Hunyuan Video, Kling AI 1.5, Hailuo, Gen-3 텍스트-비디오 모델 결과 비교
@minchoi: Grok AI에게 자신을 여러 스타일로 그려 달라고 요청하기
@mimia20071: Rive를 활용해 귀여운 워커홀릭 고양이 그리기
@mrdbourke: Google Gemini를 사용해 집안의 모든 물건을 동영상으로 추적하기
@rauchg: v0을 활용해 눈 내리는 모습 그리기
@rendernet_ai: 비공식 펩시 AI 광고
@RochereuilChlo: 노트르담 성당 복원을 기념하기 위한 VR 다큐멘터리
@samdape: Figma와 v0을 활용해 영수증을 웹사이트로 만들기
@spencerc99: Field Companions — 기억(순간, 장소)을 담아주는 일상 물품
@theworldlabs: 360도 월드 투어
@Uncanny_Harry: AI로 제작된 Vodafone 공식 광고

에세이/뉴스레터/보고서/논문

Dive Club: Some (slightly nerdy) thoughts on AI and the future of design tooling — AI 디자인 툴 활용 가이드 | Podcast w. Ramp Senior Designer Diego Zaks — 협력하는 문화의 중요성
Terrain Blog: Design Literacy in the Age of Intelligent Automation — 문해력만큼이나 중요해질 호기심, 연구된 큐레이션, 개인적인 신념, 기술의 결합
Vela’s Product Memo Newsletter: Every Studio: Transforming Content Creation into Product Innovation — 미디어, 소프트웨어, AI의 원활한 통합이 어떤 결과를 가져오는지 보여주는 프로젝트
AnchorCrafter: Animate CyberAnchors Saling Your Products via Human-Object Interacting Video Generation — 레퍼런스 제품과 상호 작용하는 사람들의 모습이 담긴 고품질 2D 동영상 생성
Data Attribution for Text-to-Image Models by Unlearning Synthesized Images — 한 번도 예술 작품을 보지 못한 AI가 예술적 능력을 기를 수 있는지에 대한 연구
DiffH2O: Diffusion-Based Synthesis of Hand-Object Interactions from Textual Descriptions — 텍스트 프롬프트를 통해 손-오브젝트 간 상호작용을 만들어 낼 수 있는 모델
EgoAvatar: Egocentric View-Driven and Photorealistic Full-body Avatars — 다양한 동작을 수행하는 사람의 멀티뷰 비디오 퍼포먼스를 평가할 수 있는 벤치마크 소개
GeneMAN: Generalizable Single-Image 3D Human Reconstruction from Multi-Source Human Data — 이미지를 고품질 3D 인간으로 쉽게 변환하는 3D 인간 재구성 프레임워크
Introducing Spatiotemporal Skip Guidance (STG) for Video Diffusion Models — 트랜스포머 기반 비디오 확산 모델을 개선하기 위한 비학습 샘플링 안내 방법 시공간 스킵 안내(STG)를 소개
I2VControl: Disentangled and Unified Video Motion Synthesis Control — 카메라 및 오브젝트 이동, 모션 브러시와 등의 모션 제어 작업을 통합하는 이미지 애니메이션 방법
Quark: Real-time, High-Resolution, and Generalized Neural View Synthesis — 고품질, 고해상도, 실시간 신규 뷰 합성을 수행하는 새로운 신경 알고리즘
L3DG: Latent 3D Gaussian Diffusion — 3D 가우시안 생성 디퓨전 모델
ReVersion: Diffusion-Based Relation Inversion from Images & TALK-Act: Speaking Avatar Reenactment — 예시 이미지에서 특정 관계(“관계 프롬프트”로 표현됨)를 학습하는 것을 목표로 하는 관계 역학 방법론 제안
SceneFactor: Factored Latent 3D Diffusion for Controllable 3D Scene Generation — 텍스트에서 3D 실내 장면 생성 및 편집할 수 있는 방법론 제안
SOLAMI: Social Vision-Language-Action Modeling for Immersive Interaction with 3D Autonomous Characters — 3D 자율 캐릭터와의 몰입형 상호 작용을 위한 소셜 시각-언어-행동(VLA) 모델링 프레임워크
TEXGen: a Generative Diffusion Model for Mesh Textures — UV 텍스처 공간에서 직접 학습하며 텍스트/이미지 기반 텍스처 합성을 가능하게 해주는 디퓨전 모델
TriHuman: A Real-time and Controllable Tri-plane Representation for Detailed Human Geometry and Appearance Synthesis — 포즈 제어 기하학 합성법과 사실적인 렌더링 품질을 구현하는 삼면 표현법
Video Depth without Video Models — 단일-이미지 디퓨전 모델을 활용해 비디오 깊이 추정기를 만드는 방법론 소개

가이드/튜토리얼

Freepik: Chillscape 비디오 제작 과정 튜토리얼
Jay From Sneek Peak: 슬랙 디자이너가 피그마 내 프로토타이핑 하는 방법 | Lattice 디자이너가 디자인 시스템 문서화를 위해 Figma와 Notion을 활용하는 방법
Magnific AI: Style Reference 활용 방식
NP Digital: 검색 순위가 높아지도록 다양한 플랫폼에 맞게 콘텐츠를 최적화 하는 것의 중요성 | Perplexity Buy With Pro 이커머스 채널 공략법
Nvidia: NVIDIA NIM 마이크로서비스를 통해 5 분 안에 콘텐츠 제작 및 디지털 디자인을 위한 AI 에이전트 구축 방법
Replicate: Hailuo_AI minimax/video-01 모델 활용한 프로덕트 디자인 비디오 가이드
The Brand Identity: Brand Book 가이드 템플릿
@boringmarketer: “콘텐츠 디자인”이 새로운 “콘텐츠 글쓰기”
@CharaspowerAI: Kling AI Virtual Try-On 워크플로우
@hvost: Product Design Career Workbook — UX 커리어 성장 가이드
@leeerob: 비디오 포스팅 워크플로우
@miggi: Figma Design (UI 3) 소개 비디오
@umesh_ai: 책 요약 애니메이션 비디오를 만든 워크플로우

무엇이 가능한지 알기 위해 공학을 이해하고, 무엇이 아름다운지 알기 위해 디자인을 이해하고, 무엇이 바람직한지 알기 위해 심리학을 이해하고, 무엇이 가치 있는지 알기 위해 비즈니스를 이해하고, 이 모든 것을 행동으로 옮길 용기를 가진 사람이 되세요 (@keshavchan)
행복이란 것은 없습니다. 현재에 대한 연약한 만족감만 존재할 뿐이며, 불행한 순간 또는 무언가를 원하는 고통이 찾아오면 그것을 얻거나 극복할 때까지 그 만족감은 깨집니다. 그러니, 이유 없는 감사, 동기 없는 아름다움, 요구 없는 사랑을 실천하시길 바랍니다 (@naval)
좋은 감각은 타고나는 것이 아니라 호기심, 공개 작업, 연습을 통해 습득 되는 것입니다. 자신을 좋은 환경에 두면, 자연스럽게 좋은 감각을 인식하고 만들어 갈 수 있게 됩니다 (@raphaelsalaja)
기술을 올바르게 적용한다면, 모두가 풍요로운 삶을 살 수 있을 만한 충분한 에너지와 물질이 있다는 것이 보편적인 사실입니다 (@simonlast)
성장은 믿음과 내면의 힘에 의지해야 하는 숨겨지고 조용한 공간에서 일어납니다. 어둠은 무덤이 아니라 새로운 시작을 위한 토대입니다 (@drex_dsgn)
지금 당장 할 수 있는 일 한 가지가 아니라 1년치 기술 습득, 업무, 성장을 머릿속에 담고 있기 때문에 버겁다고 느껴지는 것입니다 (@thedankoe)