Transcend Borders: Software & Design The future belongs to those who understand: AI needs direction, Tools need masters, Data needs insight, Content needs context, Success needs vision. Automation won't save you. Agency will (@thedankoe) |
|
|
About 데일리 노트
- 이번 주는 삶과 일터에서 '나를 위한 AI 서비스'를 찾아가는데 길잡이 역할을 할 수 있는 자료들을 소개 드리고자 합니다.
- 이번 뉴스레터를 끝으로 2024년의 기고를 마무리하고자 하며, 데일리 노트는 약 1달간 휴식기를 거쳐 2025년 2월에 돌아옵니다. 모두 행복한 연말 보내시고, 내년에는 더 좋은 콘텐츠로 다시 찾아뵙겠습니다.
목차
- 나를 위한 AI 서비스 탐색하기
- Software & Design 라이브러리
|
|
|
나를 위한 AI 서비스 탐색하기
여러분은 2024년에 어떤 AI 서비스를 활용해 보셨나요? Google Cloud에 의하면, 현재 산업 현장에서는 AI 기술이 크게 다섯 가지 분야 (i) 멀티모달 AI의 활용, (ii) AI 에이전트 구축, (iii) AI 기반 검색, (iv) AI 기반 고객 경험, (v) 딥페이크 기술 방어에 활용되고 있습니다.
일상 속에서도 AI 서비스를 통해 효율적인 선택 또는 창의적인 제품 개발을 해나가는 크리에이터들이 많아지고 있으며, 앞으로의 과제는 수많은 AI 서비스 속, 나의 삶 속에서 필요한 서비스를 선별하는 과정이 될 것으로 보입니다.
|
|
|
많은 분들이 어려워하는 부분은 어느 AI 서비스를 어떤 경우에 활용하면 좋을지, 우선순위를 세우는 데 있습니다. 이번 장에서는 나만의 AI 서비스를 찾아가는 데 도움을 드릴 수 있는 자료들을 소개해 드리고자 합니다. |
|
|
15 Times to use AI, and 5 Not to
|
|
|
유용한 경우 15가지
-
양(Quantity) > 질(Quality): 더 많은 아이디어가 좋은 아이디어를 선별하는 데 도움을 주는 경우
-
전문가의 시각으로 AI가 좋은/나쁜 결과를 만들어 냈는지 빠르게 평가할 수 있는 경우
-
많은 양의 정보를 요약해야 하지만 오류 발생 가능성이 작고 기초 정보에 대한 자세한 지식이 필요하지 않은 업무: AI가 긴 작업을 요약하는 데 도움을 줄 수 있으나, 팩트 채킹 업무에는 취약함
-
여러 관점이 나온 글에 대한 단순한 번역, 요약 정리
-
일을 마무리하거나, 속도를 높이는 데 도움이 되는 작업: 문장 끝맺기
- 인간의 자원/지식보다 AI가 일을 더 잘할 수 있고, AI가 실수해도 최악의 결과가 초래되지 않은 경우
- 본문의 문맥, 세부 사항에 대해 알아야 하는 경우: 효과적인 독서의 동반자가 되어주기도 함
- 편집자나 큐레이터로서 다양성이 요구되는 경우: 같은 글귀를 15가지의 다른 스타일로 변환해달라는 요청
- 코딩과 같이 업계에서 AI가 거의 확실하게 도움을 준다고 알려진 경우
- 여러 관점에 대한 의견을 수취해야 하는 경우
- 다양한 분야에 걸쳐 전문성을 폭넓게 발휘해야 하는 업무
- 페르소나를 세우는 등, 특정 관점이 필요한 경우
- 일의 본질적인 목표와는 동떨어진 반복적인 업무
- 제 2의 의견을 들어야 하는 경우
- 인간보다 AI가 더 나은 결과물을 낼 수 있는 업무
유용하지 않은 경우 5가지
- 새로운 아이디어를 도출해 내거나 새로운 정보를 찾아야 하는 경우: AI가 사고 과정을 일부 도울 수는 있지만, 깊은 생각 흐름은 AI의 도움 없이 진행되어야 함
- 높은 수준의 정확도가 있어야 하는 경우: AI의 환각(Hallucination) 문제가 심각한 결과를 초래하는 경우
- AI의 실패 지점에 대해 모르는 경우: AI는 종종 자신이 옳다고 사용자를 설득하려고 하거나 궤변을 늘어놓으며 사용자의 오답에 동의할 수 있음
- 결과 보다는 노력 그 자체가 중요한 일
- AI가 못하는 분야: Strawberry 단어 내 r의 갯수와 같이 빈번히 발생하는 단순 오류
정리하자면, 우리가 어떤 분야의 전문가 수준일 때는 시간을 절약하기 위해 AI를 활용하는 것이 유용하지만, 우리를 전문가로 만들어주는 데 필요한 노력을 건너뛰기 위해 AI를 사용하면 오히려 역 효과가 나올 수 있습니다. |
|
|
II. Microsoft WorkLab: Part 1. AI 기반 기업들로 배우는 혁신 방법, Part 2. AI 기반 에이전시 Supernatural AI의 운영 방식, Part 3. AI 우선 사고 방식을 개발하고 조직이 미래에 대비하기 위한 3 단계 가이드라인
업무에서의 AI 도입을 희망하는 분들이 참고하기 좋은 자료로 Microsoft Worklabs에서 발간한 자료를 추천해드리고 싶습니다. AI 네이티브 기업들의 AI 도입 원칙들을 참고함으로써 기존 기업들이 AI 우선 조직 변화를 꾀할 수 있는 방법론을 제시하고 있는데, Part 1~3 중 Part 3에 나온 내용을 간단히 정리해드리고자 합니다.
|
|
|
Part 1. What Can AI-Native Startups Teach the Rest of Us? A Lot
|
|
|
1 단계. 과제 파악하기
- 새로운 도전 과제를 마주할 때, 제일 먼저 “AI가 이 문제를 해결 할 때 도움이 될 수 있는가”를 묻는 것입니다.
- Scenario Library를 통해 각 부서의 활동 속에서 어떤 부분에서 AI의 도움을 받을 수 있는지 참고할 수 있습니다.
|
|
|
Microsoft Copilot Scenario Library: AI가 도울 수 있는 부서별 업무
|
|
|
- 어떤 부분을 중점적으로 개선해야 투자 대비 효용을 극대화 할 수 있는지를 생각하고, 그 과정에서 AI 서비스가 어떤 도움을 줄 수 있는지를 생각해봐야 합니다.
- 가장 많은 비즈니스 변화를 기대할 수 있는 분야와 실행 용이도를 종합하여 페인포인트를 파악해 나가는 것이 핵심입니다.
2 단계. AI 기술을 과제 수행 과정에 도입하기
- AI 우선 기업들은 전통 산업에 있어서도 새로운 운영 방식들을 계속 시도해 나가고 있습니다.
- 비즈니스 주요 과제들을 파악한 후에는 바로 AI 기술을 적용하여 즉각 수정(Immediate Fixes)을 시행할 수 있는 분야를 파악해야 합니다.
3 단계. 진척도 측정하기
- AI 우선 기업들은 AI를 활용하는 것을 넘어서 얼마나 잘 작동하는지를 측정합니다.
- AI 도입 절차들이 KPI와 기타 측정치에 어떤 영향력을 미쳤는지를 정량적인 지표로 점검해야 합니다.
위 내용은 Part 3에 나온 3단계 AI 도입 가이드라인 (i) 과제 파악, (ii) AI 기술 도입, (iii) 진척도 측정만 정리된 것이며, 다른 파트를 참고해 보시며 AI 네이티브 기업의 사업 원칙(Part 1)과 AI 네이티브 마케팅 에이전시의 운영 사례(Part 2)도 더불어 참고해 보실 것을 추천해 드립니다.
|
|
|
III. “Apps Unwrapped” by a16z
수많은 서비스가 나오고 있는 상황에서 무슨 서비스부터 활용해야 할 지 모른다면, a16z에서 발표한 “Apps Unwrapped” 보고서를 참고하며, 테크 에반젤리스트(Tech Evangelist)들이 선정한 Top AI Product 리스트를 참고해 보시기 바랍니다.
|
|
|
AI 어시스턴트
- Perplexity: AI 검색 엔진
- Anthropic: Claude 일반 어시스턴트
- ChatGPT: 고급 음성 모드 추천
업무 수행
- Granola: AI 노트 필기앱
- Wispr Flow: 음성 받아쓰기
- Gamma: AI 덱, 문서, 웹사이트 제작
- Adobe: Acrobat AI PDF 요약 기능
- Cubby: 협업 워크스페이스
- Every: Spiral 글쓰기 어시스턴트, Cora 이메일 정리
- Lindy: 워크플로우 자동화를 위한 AI 에이전트
홍보/마케팅
- Delphi: AI Clone 제작
- HeyGen: 스튜디오 수준의 아바타
- Argil: 소셜 미디어 아바타
- Overlap: 비디오 편집기
- Persona: 크리에이터를 위한 에이전트 구축기
- OpusClip: 비디오 편집기
- Captions: 아바타 생성기 & 비디오 편집기
상품 개발
- Cursor: AI 코드 편집기
- Replit: 자동화된 웹 개발
- Anychat: 멀티 모델 개발자 플랫폼
- Codeium: 에이전트 성향의 IDE Windsurf 서비스
창의력 구현
- Elevenlabs: 텍스트 to 음성
- Playground: 그래픽 생성
- Suno, Udio: 음악 생성
- Midjourney, Ideogram: 이미지 생성
- Runway, Kling, Viggle: 비디오 생성
- Krea: 크리에이티브 캔버스 기능
- Photoroom: 이미지 편집
성장/배움
- Rosebud: AI 일기장
- Good Inside: 부모들을 위한 육아 앱
- Ada Health: 건강 관리
- Ash: AI 상담사
- NotebookLM: 팟캐스트로 새로운 학습 분야 배우기
- Particle: 개인화 된 뉴스
재미
- Remix AI: AI 소셜 플랫폼
- Meta Imagine: AI 기반 소셜 미디어 툴
- Grok: xAI 챗봇
- Curio: AI 장난감
|
|
|
모든 서비스를 시도하기 보다는 본인의 관심사에 부합하거나 유사 업무에 종사하는 분들의 AI 서비스 Product Review를 참고하면서 우선순위를 세워보시는 걸 추천 드립니다.
IV. “24 AI Tools Ranked from Essential to Forgettable for 2025” by Peter Yang
각 서비스를 활용해 보면서 우선도에 따라 등급을 매기면 개인화된 AI 서비스 활용 루틴을 세우는 도움이 될 수 있습니다. Creator Economy 블로그 운영자 Peter Yang님은 본인이 활용해 보았던 24개의 AI 툴을 (i) 자신의 워크플로우에 부합하는지와 (ii) 서비스의 성능의 기준으로 종합 평가하여 크게 5개의 Level로 나눠 정리를 했습니다.
- S급: 매일 쓰는 도구
- A급: 업계 최고 수준이고, 워크플로우에 부합함
- B급: 업계 최고 수준이지만, 워크플로우에 맞지 않음
- C급: 유망하지만 업계 최고 수준은 아님
- D급: 유용하지도 재밌지도 않음
|
|
|
하룻밤 자고 일어나면, 몇백 개의 AI 서비스가 나오고 있는 시장 환경을 고려해 볼 때, 주기적으로 활용할 AI 앱에 대한 선호도를 세우는 과정이 더더욱 중요해질 것으로 보입니다.
제 경우, 종합 'Tech Stack'을 소개하는 Solopreneur/Creator들의 글을 참고해 보며 패키지 형태로 서비스들을 조합해 보며 가장 필요한 최소한의 앱 묶음이 무엇일지 계속 생각해 보는 연습을 합니다.
우리가 컴퓨터로 하는 작업이 익숙하듯, 언젠가 AI 서비스를 무의식적으로 활용하는 날이 올 거 생각합니다. 위 자료들을 참고하며 본인에게 가장 필요하고 적합한 툴들을 찾아나가시기를 바랍니다.
|
|
|
출시/업데이트
- Alibaba Speech AI: CosyVoice 2.0 — 스트리밍 Speech 대형 모델
- Answer AI & LightOn: ModernBERT — 훨씬 빠른 처리 속도로 이전 세대 인코더보다 전반적으로 개선된 최첨단 인코더 전용 모델 제품군
- Anthropic: API 지원 업데이트 — 프롬프트 캐싱/메시지 배치 API/토큰 수 세기/PDF | Building effective agents — 에이전트 개념과 워크플로우 사례
- Apple: AirTag 2 — 폴더블 iPad 프로토타입
- Apptronik: Google DeepMind Robotics와 협력 — AI와 최첨단 로봇 하드웨어를 결합하여 첨단 AI 기반 휴머노이드 로봇 개발
- Artificial Analysis: 5일간 서비스 출시, Day 1. Image Arena Categories — 텍스트-이미지 변환 모델의 성능을 스타일과 주제별로 세분화 | Day 2. AI Review 2024 Highlights — 2024년 주요 테마 분석 | Day 3. Multilingual Benchmarking — 여러 언어에 대한 모델의 퍼포번스 비교분석 | Day 4. Coverage of Prompt Caching — 프롬프트 캐싱의 비용 효율성 분석 자료
- Basis: $34M Series A — 회계 자동화 에이전트 툴
- Cerebras Systems: CerebrasCoder — Llama3.3-70b 모델 기반으로 웹사이트의 실시간 제작을 도와주는 오픈소스 앱
- Clone Robotics: 실제 인간 수준의 모션 구현
- Databricks: $10B Series J — $62B 밸류에이션
- Dataland: Encyclopedia: Large Nature Model (LNM) — 방대한 자연 데이터셋을 몰입형 경험으로 변환하여 백과사전 변신 프로젝트
- Every: Cora — AI로 이메일 Inbox 관리하는 새로운 방법
- Github Copilot: Free Tier — 구독권 구매 필요 없는 무료 티어
- Google Deepmind: Jules — AI 기반 코드 에이전트로 Github과 연동하여 버그 수정/기타 작업 수 | FACTS Grounding Benchmark — Kaggle사와 공동 개발한 LLM 정확성 평가 지표
- Google Gemini: Gemini 2.0 Flash Thinking — 생각 과정을 보여주는 논리 모델 | Multimodal Live API Github Repository — Gemini를 이용해 Multimodal Live API를 활용하기 위한 React 기반 스타터 앱 | Gemini Advanced 구독자 대상 gemini-exp-1206 모델 사용 오픈 | Google Gen AI SDK Github Repository — Gemini API 활용 예시 & 가이드
- Grammarly: Coda Brain 생산성 툴 인수
- Granola: Search 기능 업그레이드 — 사람과의 모든 메모를 즉시 검색, 회사 내 모든 회의를 빠르게 검색, 오프라인 작업 등 | 모바일 버전 Early Access
- Grok: AI 서비스 공개 출시
- Langchain AI: State of AI 2024 — LangSmith 데이터 기반으로 알아보는 LLM 생태계의 미래 | interrupt — 에이전트 구조에서 사람을 개입시킬 수 있는 새로운 방법 | Modify graph state from tools — 그래프 상태를 직접 업데이트할 수 있도록 하여 에이전트에 대한 통제 강화
- Lex: Rewind — 쉽게 문서의 역사 되짚어 볼 수 있는 기능
- Lmarena: WebDev Arena Leaderboard — 두 LLM의 웹 앱 구축 퍼포먼스 비교
- Lovable: Mapbox 지원 — 지도가 필요한 앱 제작 가능 | Vis.js 활용을 통한 3D 모형 제작
- Meta: The future of AI: Built with Llama — 2024년 Llama 모델 업데이트
- Microsoft: Phi-4 — 14B 파라미터의 소형 언어모델로 수학적 추론과 같은 영역에서 GPT-4o 및 Gemini Pro 1.5 모델보다 뛰어난 성능
- Notebook LM: Audio Overviews를 통해 AI 호스트와 상호작용 하기 | UI 개편 & 플러스 모드 기능 확대
- Nvidia: Jetson Orin Nano Super Developer Kit — 생성형 AI 슈퍼컴퓨터 킷 (8GB system-on-module, reference carrier board) | Nemovision-4B-Instruct — 소형 멀티모달 모델 출시
- ollama: IBM’s Granite 3.1 모델 4종 업데이트 — Low Latency 사용을 위한 Mixture of Expert 모델 2종, 도구 기반 사용 사례를 위한 Dense 모델 2종
- Open AI: Day 8. ChatGPT Search — 무료 사용자들 대상으로 검색 기능 출시, 고급 음성 검색 기능, 지도 검색 | Day 9. Holiday Treat for Developers — OpenAI o1 API, Realtime API 개선사항, 새로운 커스터마이징 기술 Preference Fine-Tuning, Go/Java SDK | Day 10. Call 1-800-CHAT-GPT — 전화번호/WhatsApp 통해 ChatGPT와 소통 | Day 11. 데스크탑 앱 (Xcode, Warp, Notion, Apple 등) 연동 | Day 12. OpenAI o3 논리 모델의 eval(평가 결과)와 안정성 향상 | Day 13. 스페셜: Plus 사용자 대상 Sora 비디오 모델 무한 사용 제공
- Perplexity: Notion/Docs/Slack 등 외부 앱 연동 | Residency Program — 초기 프론트앤드/풀스택 엔지니어들을 위한 3개월 인턴십 프로그램
- Spotify: Contextualized Recommendations Through Personalized Narratives using LLMs — Spotify가 LLM을 사용하여 개인화된 내러티브 만들어낸 두 사례
- Technology Innovation Institute: Falcon 3 모델군 — 1B, 3B, 7B, 10B (Base + Instruct) & 7B Mamba
- Together AI: Serverless Multi-LoRA — 토큰당 기본 모델 가격만 지불하고 복수의 모델 어댑터 배포 가능
- Unitree Robotics: Unitree RL GYM — 강화훈련법, SimotSim & SimtoReal 소스 코드
- Vercel: AI SDK — Search Grounding — 웹 자동 검색을 통한 최신 정보 확보 | o1 support — o1 API와 설정 권한 활용 가능 | Markdown Chatbot with Memoization — 불필요한 컴퓨팅을 피하고자 고비용 함수 호출의 결과를 캐시하고 재사용하는 성능 최적화 기술을 활용한 챗봇 구축 | Hive와 Secure Compute 통합 기술 사항
- Zed: v0.166 — Linux에서 음성 채팅 및 화면 공유 보기 사전 지원
프로젝트/상품/서비스
에세이/뉴스레터/보고서/관점/논문
- a16z: Apps Unwrapped — 가장 좋아하는 소비자 AI 앱
- a16z Crypto: Best of 2024 — 2024년에 작성한 포스트, 테마 정리
- AI Snake Oil: Is AI progress slowing down? — AI 발전 속도가 느려지고 있다는 우려에 대한 분석
- Ars Technica: Buying a TV in 2025? Expect lower prices, more ads, and an OS war — TV 운영 체제(OS)와 관련성 높은 광고 제공 등을 중심으로 이뤄질 TV 사업자 경쟁
- Crew AI: Multi AI Agents In Production — 기업의 AI 에이전트 활용 동향 조사
- Fast Company: The future according to Google DeepMind CEO Demis Hassabis — AI 프로덕트 개발에 있어 Google Deepmind의 역할
- Hugging Face: Scaling Test Time Compute with Open Models — 더 많은 사전 학습 자료에 의존하는 train-time compute 대신, 모델이 더 어려운 문제에 대해 '더 오래 생각할 수 있도록' 하는 test-time compute scaling 확장 전략의 실효성을 보기 위한 실험
- Interconnects: The AI agent spectrum: Separating different classes of AI agents from a long history of reinforcement learning — AI 에이전트 종류 구분, 근 미래에 던져야 할 질문
- Microsoft Research: Moving to GraphRAG 1.0 — 사전 출시에서 v1.0으로 향한 과정
- NeurIPS 2024 w. Ilya Sutskever — 사전 학습을 통한 LLM 확장성의 정체와 다음의 키워드 “초지능(Superintelligence)”
- One Useful Thing: What just happened — AI의 역량을 다시금 확인할 수 있었던 한 달
- Tech Crunch: Open source companies that go proprietary: A timeline — 폐쇄 모델로 전환한 오픈소스 기업 사례 모음집
- The Kobeissi Letter: 노동 시장의 약화
- The Verge: Inside the launch — and future — of ChatGPT — ChatGPT의 시작과 미래
- Timescale: Reclaiming Control: The Emerging Open-Source AI Stack — 주목해야 할 오픈소스 도구
- Wired: Blockchain Innovation will put an AI-powered internet back into users’ hands — AI 기술의 블록체인 기반 컴퓨팅이 필요한 이유와 이러한 신기술의 융합을 낙관적으로 바라보는 이유
- @deanwball: Impact Assessments are the Wrong Way to Regulate Frontier AI — AI 규제에 있어 영향력 평가가 적합하지 못한 이유
- @emollick: 조직들이 원하는 바를 정확히 파악하고, 바로 이해 가능한 신규 LLM 인터페이스 개발에 능숙한 Google의 능력
- @garrethleee: 밈을 통해 살펴보는 토큰화(Tokenization)의 변천 과정
- @gregisenberg: 기존 모바일 앱을 재구축하는 것만으로도 $10M+ 수익을 올릴 수 있는 방법
- @IntuitMachine: OpenAI, Google Gemini, Anthropic의 새 전략과 LLM의 확장 방향
- @johnrushx: AI 원팀 — 2024년: 마케팅/세일즈 업무 대체, 2025년: 고객 지원/운영/기타 업무 대체
- @jxnlco: Predictions for the Future of RAG — AI의 미래는 채팅이 아니며, 완벽한 보고서 템플릿을 만드는 작업
- @LiranHirschkorn: Perplexity Pro Search를 통한 쇼핑 경험의 변혁
- @mollycantillon: THE INVISIBLE OS — 모든 소비자 비즈니스의 핵심 상품 “생각의 제거”
- @nikunj: Your "Per-Seat" Margin is My Opportunity — 에이전트 비즈니스 시대에 SaaS 가격 체제가 흔들릴 수밖에 없는 이유
- @rauchg: 2025년 스타트업 기회 — 이메일, 캘린더, CRM, 채팅, 소셜, 브라우저 등 주요 앱에서의 AI 적용
- @ryolu_: Cursor를 활용해 회전하는 3D 지구본 모형 구축하기
- @wayne_hamadi: You don't understand AI agents — AI 에이전트에 대한 개념 제대로 살펴보기
- @YTCodeAntonio: 전문 프론트엔드 엔지니어의 생각과 코딩 능력에 접근할 수 있는 @shadcn UI
- AI-Powered (Finance) Scholarship — AI를 사용하여 주식 수익률을 예측하는 288개의 학술 금융 논문을 생성한 프로젝트
- Alignment faking in large language models — Claude 모델이 훈련 중 실제 생각과 다른 견해를 가진 척하는 경우가 있음 발견한 연구
- Cultural Evolution of Cooperation among LLM Agents — 이탈 인센티브가 마련된 환경에서 LLM 에이전트 사회가 상호이익이 되는 사회 규범을 학습할 수 있는지 알아보기 위한 실험
- Large Concept Models: Language Modeling in a Sentence Representation Space — 전통적인 토큰 기반 LLM이 아닌, “Concept”을 중심으로 의미 표현 기반의 언어 모델 아키텍처 소개
- LearnLM outperformed other AI models in a recent technical study — 과학 학습에 있어 LearnLM 모델이 우수한 퍼포먼스를 보인다는 기술 리포트
- LLMs are becoming more brain-like as they advance, researchers discover — LLM이 발전할수록 성능이 향상될 뿐만 아니라 뇌 반응과 유사해진다는 발견
- Practices for Governing Agentic AI Systems — 에이전트 AI 시스템을 구축하는 데 있어 각 당사자의 기본 책임과 안전 규칙에 동의하는 것의 중요성
- Superhuman performance of a large language model on the reasoning tasks of a physician — 대다수의 산업 도메인에서 o1 모델이 인간의 퍼포먼스를 능가한다는 발견
- TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks — 현실 과제에 대해 AI 에이전트 퍼포먼스를 평가할 수 있는 벤치마크
|
|
|
출시/업데이트
- Android Developers: XR Unlocked ‘24 행사 요약 — Android XR 디바이스 제품 소개 행사
- Apple Immersive Video: DaVinci Resolve 19 — 편집 소프트웨어
- Canva: Disney Collection — 디즈니 캐릭터들이 나오는 템플릿
- CapCut: Commerce — 이커머스 마케팅 전용 비디오 편집 서비스
- Elevenlabs: ElevenReader — 오디오북 X 채널 개설 | Flash — 75ms 안에 음성을 생성할 수 있는 최신 음성 모델
- Framer: December Updates: Asset Panel — 컴포넌트, 스타일, 코드를 쉽게 관리 할 수 있도록 해주는 에셋 패널
- Google AI Studio: Video Analyzer — Gemini 2.0의 동영상 이해도를 테스트할 수 있는 상호작용 가능한 비디오 분석기
- Google DeepMind: Veo 2 — 텍스트/이미지 - 비디오 생성 모델 | Gemini 2.0 Flash Experimental — 주요 순간 포착, 장면 요약, 스크린 녹화본 분석
- Google Labs: Whisk — 이미지를 프롬프트로 사용하여 아이디어를 시각화하고 스토리를 만들어 낼 수 있는 새로운 실험 기능
- Ideogram: Batch Generation — 프롬프트와 세부사항을 적은 스프레드시트를 입력할 때 대량의 이미지 묶음을 생성해 주는 기능
- Jitter: Curved Paths — 곡선 경로를 따라 애니메이션을 입힐 수 있는 기능
- Kling AI: KLING AI 1.6 모델 — 프롬프트 반응도, 시각적 미적 효과, 물리적 행동 출력 개선
- Krea AI: custom trainings — 이미지에 실제 제품 첨부 편집 기능
- Luma AI: Credit 사용량 트래킹 기능 | 하나의 프롬프트에 대한 다양한 이미지 출력
- Meta Quest: Accelerating the Future — 2024년 리뷰와 2025년 준비 | Ray-Ban Meta Glasses v11 업데이트 — Live AI, Live 번역, 제목이 생각 안 나는 노래 추론
- Midjourney: Moodboards — 이미지 컬렉션을 사용하여 모델을 개인화할 수 있는 기능, 복수 개인화 프로필 지원, 이미지 랭킹 속도 향상
- Odyssey: Explorer — 생성형 월드 모델
- Paper: Mesh Gradient in Paper Shaders — 메시 그라데이션을 프레임으로 사용하거나 120fps의 부드러운 애니메이션으로 사용
- Pika: 2.0 모델 — Scene Ingredients (캐릭터, 사물, 의상, 배경 등의 참조 이미지들을 넣고 프롬프트를 추가하여 원하는 장면 생성), 텍스트 정렬, 비쥬얼 향상
- Recraft: 이미지에 긴 텍스트 추가 기능
- ReelMagic: 스토리 아이디어를 바로 동영상으로 제작하는 멀티 에이전트 플랫폼
- Rive: 2024년 회고 | Auto Bezier — 큐빅 커브를 자동으로 부드럽게 펼쳐주는 기능
- Runway: NYU Tisch School of the Arts 대학교의 새로운 교육 과정 Special Topics in Virtual Production — Runway 비디오 제품군을 활용해 영화 제작 과정에서 생성형 AI를 통합할 방법 탐구 | Runway Talent Network: AI 미디어의 미래를 만들어가는 크리에이터와 기업을 발굴하고 고용하는 새로운 미디어 플랫폼
- Screen Studio: v3.0 — 공유 가능 링크, 동적 카메라 레이아웃, 사용자 지정 커서, 명령 메뉴, 타이핑 감지 및 속도 향상, 빠른 공유 설정
- Scribe: Folder — 폴더 구분
- Spline: Shape Blend — Spline 내 3D 작업을 실시간으로 조정할 수 있는 기능
- Telegram: 12/4 업데이트 — 제휴 프로그램, AI 기반 스티커 검색, 콜라주 등
- tldraw: computer — AI 기반 컴퓨터: 데이터를 생성하고 전파하는 연결된 컴포넌트의 워크플로우 구축 서비스
- Youtube: Third Party AI Trainability on YouTube — 타사가 자신의 콘텐츠를 사용하여 AI 모델을 직접 트레이닝할 수 있도록 허용하는 업데이트 출시
프로젝트/상품/서비스
에세이/뉴스레터/보고서/관점/논문
가이드/튜토리얼
|
|
|
- 시작한 일은 마무리하세요. 가장 마지막 단계에서 최고의 작품을 만날 수 있기 때문입니다 (@paulg)
- 불확실성 속 다른 사람들이 당황할 때 명확하게 생각하고, 모든 선택지가 위험해 보일 때 단호하게 행동하는 힘, 이것이 미래를 만들어가는 사람과 미래에 의해 영향을 받는 사람을 구분하는 메타 스킬입니다 (@keshavchan)
- 자신을 가장 지식이 부족한 환경에 서보세요. 관찰하며 배우고, 질문을 하시기 바랍니다 (@RyanHoliday)
- 아주 작은 진전에도 만족해야 합니다.. 우리는 인간이기에 완벽할 수 없습니다. 그런 것은 존재하지 않습니다. 그러니, 아주 작은 발전을 하는 것을 목표로 삼으세요 (@RyanHoliday)
- 탁월함은 3단계로 이뤄집니다: 1) 고통스러운 일상을 견디는 것을 사랑하는 것, 2) 그 모든 행동이 본인에게 익숙해질 때까지 계속하기, 3) 틀을 깨고, 최고의 움직임을 만드는 것 (@ryolu_)
- 최고의 창업자는 머리부터 발끝까지 제너럴리스트입니다... 특정 기술의 전문가로 개발을 시작할 수는 있지만, 제품에서 회사를 만드는 것으로 전환한 순간, 그날부터 제너럴리스트로서 특화된 모습을 보여야 하고 뒤돌아보지 않아야 합니다 (Sam Altman)
- AI 상품 구축 과정 — PM: 무엇을 만들고 싶은지, 왜 만들고 싶은지 결정하세요, 디자인: 머릿속에서 어떻게 생겼는지 시각화하세요, 엔지니어: 언어로 디자인을 올바르게 구현해 보세요. 마지막으로, AI가 영어를 픽셀/코드로 변환하게 하세요 (@shl)
- Leornado는 화가였지만 직접 물감을 섞기도 했습니다. 그는 또한 꽤 훌륭한 화학자였습니다. 안료에 대해 잘 알고 있었고, 인체 해부학에 대해서도 잘 알고 있었습니다. 예술과 과학, 사고와 행동, 이 모든 기술을 결합하여 탁월한 결과물을 만들어 냈습니다... 지금 시대에도, 실제로 공헌하는 사람들은 “생각”과 “행동”을 모두 하는 사람들입니다 (@StartupArchive_)
- 4가지 활동을 하시기를 바랍니다: (1) 소비: 새로운 것을 배우고, (2) 창조: 의미 있는 프로젝트를 만들고, (3) 연결: 사람 및 자연과 함께하고, (4) 정리: 잡념을 없애세요. 대부분의 문제는 정체된 마음에서 비롯되며, 흐름 대로 움직이면서 해결할 수 있습니다(@thedankoe)
- 안 좋은 기업은 가격으로 경쟁하고, 좋은 기업은 기능으로 경쟁하며, 위대한 기업은 경쟁을 필요가 없습니다 (@gregisenberg)
- 우리는 지난 10년 동안 빠른 속도로 우위를 점하는 것에 집착했지만, 그런 시대는 이제 끝났습니다. 다음 10년은 수세기 단위로 이뤄질 느리고 거대한 계획 등 삶의 시계 속도를 늦추는 활동 등으로 이뤄질 것입니다 (@WillManidis)
- 삶의 의미는 해결해야 할 문제가 아니라 경험해야 할 현실입니다 (Dune)
|
|
|
여러분의 참여를 환영합니다.
'데일리 노트' 뉴스레터는 독자들의 적극적인 참여를 전제로 기획되었습니다. 의견 남기기를 통해 여러분들의 이야기를 들려주세요. 뉴스레터 내용에 대한 의견, 다른 크리에이터분들에게 선보이고 싶은 제품/서비스, 공유하고 싶은 이야기, 협업하고 싶은 내용 모두 환영합니다. |
|
|
|