데일리 노트: “나”를 표현하는 방식의 확장

Transcend Borders: Software & Design

2024. 11. 11.

데일리 노트 뉴스레터

Your first thought is what everyone else thinks. Your best thought comes after you’ve thought long enough to forget what everyone thinks (@ShaneAParrish)

About 데일리 노트

11월 둘째 주 뉴스레터로 인사드립니다. 이번주 목요일, '테크잇슈(IT 커뮤니케이터가 만드는 쉽고 재밌는 IT 트렌드 레터)' 에 두 번째 글을 기고하게 되었습니다. "AI 검색 엔진"에 대한 얘기를 담았으니, 관심 있으신 분들은 구독하셔서 살펴보시길 바랍니다.
이번주는 "나"를 표현하는 방식을 다채롭게 만들어 줄 크리에이티브 도구에 대한 얘기와 Open AI의 마케팅 웨비나 내용을 따라한 개인 경험담을 공유드리고자 합니다.
이번 데일리 노트도 재미있게 읽어나가시길 바라며, 11월 셋째 주 뉴스레터로 다시 찾아뵙겠습니다. 뉴스레터 내용에 대한 의견이 있으시다면 언제든 편하게 남겨주시기 바랍니다.

“나”를 표현하는 방식의 확장
마케팅 업무에서의 AI 활용
소프트웨어 & 디자인 라이브러리

“나”를 표현하는 방식의 확장

사람들이 SNS 또는 블로그에 글을 쓰고, 그림을 그리고, 동영상을 찍으며, 그 행위를 타인들과 공유하는 궁극적인 이유는 나의 생각을 타인과 공유하기 위함이라 생각합니다. 인터넷을 통해 우리는 더이상 “나”의 물리적 실체를 드러내지 않으면서 생각을 표현할 수 있게 되었고, AI 도구의 발전으로 이제는 가상의 나(이른바. 아바타)를 만들어 나를 대표하는 디지털 객체를 만들 수 있게 되었죠. 이번 장에서는 나를 표현하는 방법의 다양성을 한 단계 더 확장 시켜주는 Runway 사의 Act One 기능에 대한 얘기를 하고자 합니다.

I. Runway사의 Act One 기능

사실적인 장면 연출로 명성이 높은 비디오 생성형 AI 스타트업 Runway는 10월 22일, 캐릭터의 표현력을 확장시키는 새로운 방법인 ‘Act One’ 기능을 발표했습니다. 이 기능은 내가 원하는 캐릭터로 하여금 실제 비디오 속 인물의 행동/표정/말을 따라할 수 있게 해주는 캐릭터 애니메이션 시스템입니다. 캐릭터 디자인과 스타일을 선택하고, 실제 인물이 나오는 비디오를 업로드 하면, 내가 설정한 캐릭터가 인물의 표정 변화를 그대로 따라하는 결과물이 도출됩니다.

Act One
출처: Runway

이 기능의 가장 큰 효용은 간편함입니다. 휴대폰 기기 하나 만으로도 여러 모습의 "나"를 만들어 낼 수 있습니다. 캐릭터와 실제 비디오 안에서의 배우의 말, 행동을 동기화하는데 필요한 기술적인 지식을 몰라도 실행 가능하며, 특수 분장 없이도 내가 원하는 캐릭터로 "변장" 할 수 있게 되었습니다. 배우의 아이라인, 작은 표정 변화, 말 속도와 전달 방식 등 미세한 변화까지 캐릭터가 따라하는 Act One 기능의 복제 능력을 활용해 누구나 손쉽게 "부캐" 활동을 할 수 있게 되었는데, 여러분은 누구로 변신하고 싶으신가요?

개그우먼 김신영님, 김다비님
출처: 미디어랩 시소

III. 생각 정리

최근 들어 비언어적인 방식으로 자신의 생각을 표현하도록 해주는 기능들이 여럿 출시되고 있습니다. 스타일과 스토리만 제공하면 그에 맞는 아바타를 만들어주는 HeyGen의 새로운 기능도 나왔으며, X(SNS) 프로필을 입력하면, 프로필에 축적된 데이터에 기반하여 커스터마이징 된 음성 파일의 페리소나를 생성해주는 Elevenlabs의 기능도 있습니다. 제 트위터 계정에 대해 Elevenlabs의 X-to-Voice 기능을 넣어봤는데, 놀라운 결과를 받게 되었습니다. 제 목소리에 대한 설명이 제시되었었는데, 제가 진짜 누구인지와 무관하게 타인들이 저를 어떻게 생각했을지 다시금 생각하게 되었습니다.

Voice Description

"서울에서 살고 있는 30대 남성의 목소리가 그려집니다. 이 목소리는 느긋하고 내성적인 어조를 갖고 있으며, 삶과 기술의 복잡성에 대해 깊이 고민하는 사상가를 연상시킵니다. 음정은 너무 높지도 낮지도 않은 중간 정도이며, 재치 있는 해설을 전달하기에 적합한 부드러운 어조를 가지고 있습니다. 그가 말할 때는 자신감 넘치고 약간 놀리는 듯한 말투로 미묘한 풍자가 묻어납니다. 그의 말은 신중하게 진행되고, 개념 사이 사이 공백이 묻어있어, 청중이 생각할 수 있도록 유도합니다."

Elevenlabs X to Voice 결과 페이지

과거에는 프라이버시 보호를 위해 컴퓨터에서의 나의 활동 기록을 지우는 노력들이 이뤄졌다면, 지금은 그동안 축적해온 디지털 흔적들을 오히려 활용해 자신의 모습을 한 층 더 깊이 이해하려는 노력들이 이뤄지고 있습니다. 한 예로, AI 챗봇에게 “나에 대해 알고 있는 것을 바탕으로 현재/미래 내 삶이 어떤 모습인지/일지 그림으로 그려줘”라는 프롬프트를 입력하여 '내가 아는 나'와 '디지털 디바이스가 아는 내'가 동일한지 알아보는 실험들도 이뤄지고 있습니다.

“나”를 표현할 세계가 넓어지고 깊어진 만큼, 크리에이터들이 창의적인 생각을 전달하고, 그 생각을 표현하는 방식도 다채롭게 펼쳐질 거라 생각합니다. 과거에는 컴퓨터의 GUI (Graphic User Interface)를 사이에 두고 글이라는 매개체를 통해서만 생각을 전달했다면, 앞으로는 GUI 안에서의 움직임을 한 층 더 깊이 조율하는 창작 환경이 만들어 질 것 같습니다.

마케팅 업무에서의 AI 활용

지난 10월 14일, 데일리 노트 뉴스레터를 통해 회계 업무에서의 Open AI 활용 웨비나 내용을 공유 드렸었습니다. 이번에 진행된 두 번째 웨비나 “마케팅 업무에서 AI의 활용: 콘텐츠 생성을 넘어서다” 에서는 Open AI 플랫폼 내 다양한 기능들이 활용되는 모습이 비춰졌습니다. (i) 검색 엔진 Search GPT, (ii) 코딩/글쓰기 협력 툴 Canvas, (iii) Chat GPT 4o 모델의 Vision 인지 능력(ex. 캡쳐 화면, 사진, 낙서 내용의 이해), (iv) 음성으로 ChatGPT와 상호작용 할 수 있는 Advanced Voice Mode도 같이 소개 되었으니, 전반적인 OpenAI 생태계에 대해 알아가고 싶은 분들에게 적극 추천 드립니다.

마케팅 업무에서의 AI 활용
출처: Open AI

이번 장에서는 웨비나에서 배운 스킬들을 활용해 (가상의) ‘데일리 노트 구독자 커뮤니티 모임’ 웨비나 행사를 준비한 과정을 공유 드리고자 합니다.

I. 아이디어 단계

프롬프트 1: "개발자분들이 많이 오는 커뮤니티 모임에서는 어떤 이벤트를 준비하면 좋을까요? 자신이 직접 가져온 컴퓨터로 직접 참여할 수 있는 이벤트였으면 좋겠으며, 비개발자분들도 쉽게 참여할 수 있으면 좋겠습니다. 다섯 종류의 이벤트를 추천해 주시기를 바랍니다."

참고. 최근에 OpenAI가 발표한 검색 엔진 ChatGPT Search 기능을 활용하여 검색을 진행했습니다. 하단에 지구 모양을 누르면 SearchGPT가 활성화 됩니다.

Search GPT 작동 방식

참고. 각 추천에 대한 출처를 항목 옆에서 직접 들어갈 수 있으며, 아래 하단에는 모든 출처들이 제시되어 있습니다.

프롬프트 1 결과

II. 준비 단계

프롬프트 2: "이 사진은 제가 메모장을 통해 정리한 행사 To-Do 리스트입니다. 사진에 나와 있는 내용을 보아, Alice가 수행해야 하는 업무를 한눈에 보기 좋은 시각적 자료를 하나 만들어주시기 바랍니다."

참고. ChatGPT는 그림, 낙서 등의 시각적 자료를 읽을 수 있습니다. 그 능력을 활용해 캡쳐 페이지에 대한 데이터 분석을 추가적으로 진행해 달라고 요청한 상황입니다.

첨부한 켑쳐 페이지

프롬프트 2. 결과

참고. 몇번째 항목인지를 나타내는 첫 열에 대한 삭제 요청은 직접 그 열을 눌러 “삭제” 요청을 하면 됩니다.

프롬프트 3: "행사 포스터를 만들려고 합니다. 이번 행사는 11월 13일에 ‘데일리노트’ 뉴스레터 구독자분들 대상으로 성수동 카페에서 진행하는 커뮤니티 행사입니다. 총 3분의 연사 세션이 준비되어 있고, 마지막에는 이벤트 세션이 있습니다. 세 개의 이벤트 (1) 노코드(No-Code) 툴 체험 워크숍, (2) 해커톤(Hackathon), (3) 디자인 씽킹 워크숍 중 하나 필수적으로 참석해야 합니다."

프롬프트 3. 결과

참고. 포스터 디자인의 경우, 처음부터 원하는 디자인을 도출하기 어렵고, 사후 편집이 복잡하기 때문에 ChatGPT사용을 권장하지 않습니다. 도형을 눌러, 그 위에서 직접적인 편집 요청이 가능하오나, 제가 할 때는 수정 요청 사항을 반영하지 않는 오류가 나타났습니다.

프롬프트 4: "웨비나의 내용을 재밌게 전달하며 이름, 이메일, 직업군을 입력할 수 있는 등록 페이지를 만들어주시기 바랍니다 → 이 등록 페이지에 대한 HTML 코드를 작성해주시기 바랍니다."

프롬프트 4. 결과

참고. 기존에 참고 하고 있었던 형식으로 등록 페이지를 만들고 싶은 경우에는 해당 화면을 캡쳐하고 유사한 형식으로 만들어 달라고 요청하면 됩니다.

III. 행사 이후 단계

프롬프트 5: "(첨부) 엑셀에 참석자 명단이 적혀있습니다. 참석한 분들의 직업군을 분석하여 가장 많이 오는 직업 분야부터 가장 적게 오는 직업 분야까지 표로 정리해주시기 바랍니다."

(첨부) 엑셀 파일

프롬프트 5. 결과

프롬프트 6: "이벤트가 성공적으로 마무리 되었습니다. 참석자들이 참여한 이벤트 별 평균 만족도를 막대 그래프로 만들어 주시기 바랍니다. 평균 만족도 순위 별로 왼쪽에서 오른쪽으로 배치해주시기 바랍니다."

프롬프트 6. 결과

참고. 각 요소 위에 마우스를 데면 각 요소에 대한 평균 만족도를 살펴볼 수 있습니다. 또한, 도형의 색깔을 바꿀 수 있습니다.

III. 생각 정리

ChatGPT를 가상 웨비나 행사의 마케팅 활동에 쓰게 되며, 어떤 분야에 있어 ChatGPT를 사용하면 좋고, 어떤 부분에는 사용하면 만족스러운 결과를 얻지 못하는지 알 수 있었습니다. 아이디어를 기획하는 단계에서의 제안 또는 데이터 분석 및 시각화 부분에서는 출력물이 빨리 도출되었을 뿐만 아니라, 시각화 모형에 대한 수정을 직접 할 수 있어서 편했습니다. 반면, 포스터 제작, 원하는 그래프 제작 등의 디자인 작업은 프롬프트로 요청하기보다는 직접 그려보며 요소들을 편집하는 것이 더 적합하다고 보였습니다.

SOFTWARE (소프트웨어)

출시/업데이트 (Release/Update)

Altera — Project Sid Tech Report: AI 에이전트 문명에 대한 테크 리포트
Amazon Prime Video — X-Ray Recaps: 시청 시점에 맞춰 개인화 된 프로그램 요약을 생성하여 시청자에게 스포일러 없이 최신 정보를 제공하는 AI 기능
Anthropic — Claude Visual Recognition: 차트 및 그래픽 등 PDF 내 사진을 관찰할 수 있는 기능, Claude 3.5 Haiku: 코딩/도구 활용/논리력 갖춘 AI 모델
Autogen — Magnetic-One: 개방형 웹 및 파일 기반 작업을 위한 범용 5-에이전트 멀티에이전트 시스템
Dexterity Hub — DART: 클라우드 호스팅 시뮬레이션에서 누구나 로봇을 원격으로 조종 할 수 있는 AR 인터페이스
Etched — Sohu: 첫 트랜스포머 응용 특정 집적 회로 (ASIC) 칩
Github — OpenAI o1 Waitlist 신청, Visual Studio Code: Github Copilot의 PR/이슈 요약
Google AI — API Call 방법 간소화, Cody AI 개발사 Sourcegraph의 Gemini 1.5 Flash 1M 컨텍스트 윈도우 경험담
Granola : 이미지 지원 등 멀티모덜 버전 업데이트
Hugging Face — SmolTools: 실용적인 방식으로 SmolLM2 소형언어모델을 활용하는 도구
Microsoft Copilot — Browser Copilot Vision: 브라우저가 화면을 관찰할 수 있는 기능
Mistral AI — Moderation API (LLM 분류기, 다중언어 지원, 텍스트/대화형 인풋 엔드포인트), Batch API (50% 낮은 가격, 감정분석/데이터 레이블링 등 대규모 작업을 위한 비동기 처리)
Notion — Database Automations: 공식을 통해 더 많은 액션 자동화하기, 웹 콘텐츠 저장 방법
Nous Research — Nous Chat: Hermes 3 70B 모델을 활용하는 새로운 유저 인터페이스
Ollama 0.4: Llama 3.2 Vision 1B, 90B 지원
Open AI — Predicted Outputs: 이전 대화 속 정보를 참고하여 GPT-4o, GPT-4o-mini 답변 대기 시간 감소, Mapbox Maps Integration: ChatGPT Search 내 지도 기반 정보
Oxford Labs — Agora: 다양한 에이전트 사이 효율적인 소통을 위한 프로토콜
Perplexity — Claude 3.5 Haiku 탑재
Replit Agent 업데이트: 더 많은 프레임워크/컴포먼트/데이터베이스 지원, 비용 체계 개선, 새로운 채팅방/멀티 세션 지원
Standard Intelligence — hertz-dev: 대화형 오디오를 위한 오픈소스 모델, Hugging Face 통해 다운/사용 가능
Telegram: Video Platform 및 기타 업데이트
Tencent — Hunyuan-Large: 52B 활성화 된 파라미터의 오픈소스 트랜스포머 기반 전문가조합(MoE) 모델
v0: 퍼블리싱 완료된 블록을 통해 프로그레시브 웹 앱 (PWA) 생성 가능
xAI: Grok API 퍼블릭 베타 무료 크레딧 제공

상품/서비스/도구 (Product/Services/Tools)

Claude Vision Object Detection: 이미지 내 물체를 인지, 시각화하기 위한 Claude 3.5 Sonnet Vision API
Hex Tech — Explore: 노코드 데이터 탐색 도구, 활용 방법 웨비나 (11/13, 현지시간 5-530AM)
Hume App — 자체 스피치-언어 모델 EVI2로부터 생성된 음성 및 개성을 활용한 어시스턴트 출시, Everfriends 플랫폼 내 공감 음성 인터페이스를 통합
Raycast Notes: 빠르고, 가볍고, 방해 없는 노트 테이킹
Sona: 대화로부터 중요한 인사이트를 도출해주는 앱
VERDAD: Gemini 1.5 모델을 통해 라디오 방송에서의 허위 정보를 발견하는 프로젝트

가이드/기타 (Guide/Others)

AI Show & Tell: AI를 아는 것과 느끼는 것의 차이점
Anthropic — Claude PDF Assistant: 논문 읽는데 활용하는 방법
DeepLearning — LLMs as Operating Systems: Agent Memory: 긴 대화를 하는 챗봇, 복잡한 상담원 워크플로우를 구축하는데 중요한 LLM의 메모리 관리에 대한 강의
LlamaIndex — Introduction to Report Generation: 사내 DB와 연결하여 자동 보고서 작성법, AI Powerpoint Assistant: 구글 시트 데이터 해독 → 시각화, 표 생성 → 데이터 기반 프리젠테이션 자료
No Priors Podcast: Nvidia의 Jensen Huang이 밝힌 엔비디아의 10년 후 목표와 데이터 센터, 칩 디자인, 내제화된 AI, AI 고용인, 과학과 AI의 연계에 대한 생각
OpenAI: 마케팅 업무에서의 AI 활용
Open AI & Anthropic CPO: AI를 일터에서 활용하는 방법과 AI의 미래
Shopify: 모바일 앱을 React Native로 마이그레이션 한 경험 공유
Together AI — How to Implement Contextual RAG from Anthropic: Contextual RAG의 실행방법
Vercel & NVIDIA가 공동주최하는 세상에서 가장 짧은 2시간 해커톤 (11월 21일, 4:30PM)
Weaviate — What is Agentic RAG: 기초, 작동방식/구조, 일반(Vanilla) RAG와의 차이점, 실행방식, 기업들이 Agentic RAG를 적용하는 이유
xAI Grok: xAI API(베타)를 활용한 간단한 주식 분석 앱을 만드는 방법, X (구. Twitter)상 개인 포스트 분석
AI 프롬프트 템플릿
멀티모덜 LLM 이해하기: 최근 기술, 모델에 대한 소개 자료
소형언어모델 종합 서베이 연구: 정의, 애플리케이션, 개선사항, 신뢰도 등

DESIGN (디자인)

출시/업데이트 (Release/Update)

Black Forest Labs — FLUX 1.1 [pro]: 4x 높은 사진 화질 개선, 샘플마다 최대 10초 생성 시간
Bytedance — X-Portrait 2: 표현력이 뛰어난 인물 애니메이션
Decart — Custom Worlds: 생성형 AI World Model 플랫폼 Oasis내 원하는 사진 가져올 수 있는 기능
Figma — Underline: 밑줄 기능 활성화
Framer — Variable Fonts: 변동 가능한 폰트 기능, Google Sheet Plugin: 구글 Sheet 콘텐츠 → Framer CMS 내 싱크 가능
HeyGen: 카메라 없이 생생한 아바타를 만들 수 있는 방법 (생성 → 스타일 → 스토리텔링)
Krea AI: 캐릭터, 스타일, 제품 등에 대한 AI 모델 학습
Leornado AI — Editorial Illustration: 글 내용을 보완하기 위한 일러스트 효과
Recraft — Graphic Design Generator: 간편하게 그래픽 만들 수 있는 기능
Rive — Layouts: 레이아웃 사이의 요소들을 연결할 수 있는 기능
Runway — Advanced Camera Control: 촬영 화면의 방향, 의도 결정하기
Udio Music — Project Folders: 생성한 트렉 관리 가능한 폴더 보관 기능

프로젝트 (Project)

Notebook LM — 새로운 모습의 홈 화면
Perplexity — Loading to Input 애니메이션
Replit — 리브랜딩을 위한 초기 탐구
Lucas Crespo: 기술 & 예술
Zach Hamed: 디자인 중심 엔지니어 포트폴리오
Digital da Vincis AI Studio: Runway와의 파트너십을 기념해 제작한 키네틱 타이포그래피
AI 생성 대화로 진행되는 새로운 유형의 토크쇼
v0을 활용한 데이터 시각화
Rive를 활용해 디자인 된 자동차 UI
Runway의 Act One & Camera Control로 표현한 끝없는 구덩이에 빠지는 과정
Groq & AI Proxy & TMDB를 활용해 제작한 영화 추천 앱
Swift UI(애니메이션) & Cursor(프롬프트) & XCode(프리뷰, 빌드업)을 통해 제작한 iOS 앱
Midjourney Retexture & 3D 모델링 소프트웨어를 활용한 창의적인 작품
Midjourney & Hailuo를 활용해 어린이 동화 장면을 현실화 시키기

상품/서비스/도구 (Product/Services/Tool)

BLENDERGPT: 텍스트/이미지 프롬프트로부터 3D 모델을 생성할 수 있는 프로그램
Craft: 다양한 방식으로 문서를 디자인 할 수 있는 툴
Daze: 자유로운 캔버스를 통해 소통하는 소셜 앱
GVHMR: 좌표로 표현되는 인체 모션 캡쳐
Layer AI: 게임 디자인 생성형 AI 도구
Moodpaper: 감정을 월페이퍼로 전환해주는 디자인 도구
Remotion: 개인화 데이터 기반, 실시간 편집, 빠르고 서버가 필요 없는 랜더링 가능한 비디오 생성 도구

가이드/기타 (Guide/Others)

생성형 시대에서의 UI/UX 관습
Figma — Mask 활용 방식
Midjourney — Retexture 기능을 활용해 이케아 가구 디자인에 디자인 입혀보기, 일반 사진 이미지에 스타일 입히기
Ridd Design: Airbnb's VP of Design (Teo Connor)과의 담화, Claude/Cursor를 활용해 코드로 디자인 하는 방법
Runway — Camera Control 활용 방식, Gen 3 Turbo Extend 활용해 Midjourney에서 만든 캐릭터 걷고, 앉히기

생각이 꼬리에 꼬리를 물어

당신의 첫 번째 생각은 다른 사람들의 생각입니다. 다른 사람의 생각을 잊을 만큼 충분히 생각한 후에 가장 좋은 생각이 나옵니다 (@ShaneAParrish)
아주 작은 일에도 즐겁고, 낙관적이고, 추진력 있고, 흥분하고, 감사하는 마음을 갖는 방법을 알아내세요. 그렇게 되면, 누구나 당신과 함께 보내는 시간을 즐거워 할 것이며, 이를 통해 더 많은 기회를 만들어 낼 수 있습니다 (@orangebook_)
상상할 수 없는 일을 위한 마음의 여유 공간을 남겨두세요 (Mary Oliver)
4가지 인생의 씁쓸한 현실: 관계는 강요하지 않을수록 강해진다, 모든 목표를 원래 다 달성 하지 못한다, 사람들이 자신이 대체 뭘 하고 있는지 제대로 알지 못한다, 당신이 마땅한 이유를 주지 않는 한 사람들은 당신에게 관심이 없다 (@IAmMarkManson)
가능하면 모든 새로운 기술을 나오는 즉시 본인을 위해 사용해보세요. 모든 신기술을 채택하거나 사랑해야 한다는 의미는 아니지만, 세상에 대한 부정확한 사고를 갖는 것을 방지할 수 있습니다 (@rauchg)
지금까지 본 제품 포지셔닝에 대한 최고의 정의: “타겟 고객의 머릿속에 '이런 상황에 가장 적합한 제품'이라는 공간을 만들고, 그 공간에서 확실한 점유율을 확보하는 것” (@ivanhzhao)
삶을 바꾸고 싶다면, 한 달 동안 부정적인 말을 하지 않고, 싫어하는 일들에 대해 행동하며 실천해보시길 바랍니다 (@drgurner)
사람들이 아이디어를 가진 것이 아니라, 아이디어가 사람들을 지배하는 것입니다 (Jung)