Transcend Borders: Software & Design "I want to live in a world where people’s creativity is the only bottleneck to what they can create" (@ErikSchluntz) |
|
|
About 데일리 노트
이번 월요일 편 뉴스레터는 "소프트웨어 & 비즈니스" 주제의 이야기들을 담았습니다. 이번 데일리 노트도 재밌게 읽어나가시길 바랍니다.
- 목차
- No-code 시대
- ChatGPT와 Claude가 새 스타트업들의 행렬을 불러올 이유
- Digital Human
- 소프트웨어 툴 Release/Update
다가오는 목요일 편 뉴스레터는 “디자인 & 아이디어” 주제의 이야기들로 구독자분들을 다시 찾아뵐 수 있도록 하겠습니다.
|
|
|
No-code 시대
- 직접 코딩 하지 않아도 되는 ‘노코드 시대’가 벌써 우리 곁에 왔음을 알리듯, 지난주 X 커뮤니티에서는 AI 툴만을 활용해 소프트웨어 개발을 진행한 경험담들이 공유되었습니다.
- “X 유행에 이끌려 Claude를 활용해 코딩을 해봤습니다. 크라미스마스 아침에 눈을 뜬 아이가 된 기분입니다. 어떤 엉뚱한 것들을 새로 만들지 상상하는 것을 멈출 수가 없습니다.” (@manosaie)
- 많은 경험담 중에서도 제가 가장 인상 깊게 봤던 글은 Anthropic사의 Technical Staff로 재직 중인 Erik Schluntz가 오른쪽 팔을 다쳐, 어쩔 수 없이 1달 동안 자사 모델인 Claude만을 활용해 코딩 했던 경험담을 담은 글 “AI로 내 오른쪽 팔을 대체했다(Replacing my Right Hand with AI)” 입니다.
- Claude 활용 방식, 소감, 조언을 비롯해 “AI 엔지니어"가 활동하는 미래 소프트웨어 AI의 방향까지 여러 방면에서 생각할 거리를 남기는 글의 주요 내용을 요약해 드리고자 합니다.
-
- I. 배경
- 자전거를 타고 출근하다가 오른쪽 팔이 부러져 어쩔 수 없이 음성-텍스트, Claude 툴을 활용해 일(코딩)을 할 수밖에 없는 상황
- 의도했던 시간은 아니었지만, 직접 코드를 짜지 않는 미래를 일찍 경험할 수 있었던 것이 가장 좋았음
-
- II. 준비과정
- 이전에 Copilot과 같은 코드 생성 툴을 활용한 적은 있으나, 직접 코드를 작성하는 시간이 더 많았음
- 휴대폰 문자를 보낼 때 음성-텍스트 툴을 활용한 바 있으나, 컴퓨터로는 활용 한 바 없음
- 작업 진행 방식: Claude에게 많은 양의 코드베이스 입력한 후, 특정 형식으로 코드를 변환해달라고 구두로 요청
- ex. “ABC 함수가 입력값 XYZ를 수용하도록 재배열”
-
- III. Claude 활용 과정 중 느낀 점
- 어떤 프롬프트 명령이 가능하고, 불가능한지 판별할 수 있게 됨
- 어느 순간에는 마법처럼 명령 그대로 산출물이 나왔지만, 또 어느 순간에는 컴퓨터를 창문 밖으로 던지고 싶을 만큼 답답한 순간도 많았음
- IDE(통합개발환경) ↔ Claude, 번갈아 코드를 붙이는 과정에서 Claude 입력값 제한으로 코드가 중간중간 짤리며 시간 소요
- Claude가 이전 명령을 잊었을 경우, 기기에게 언성을 높이기도 함
-
- IV. Claude 활용시 조언
- 최대한 구체적으로 접근하고, 예시를 제공하라
- 기본 요청만을 할 경우, 중간 수준의 일반론적 답변이 나올 것이기에 구체적인 코드베이스에는 적합하지 않을것
- 더 나은 결과를 위해서는
- 인풋을 입력했을 때 기대하고자 하는 아웃풋 값에 대한 직접적인 기대 명시
- 사용해야 하는 라이브러리 지정
- 명령문을 데이터/문맥 앞뒤에 중복으로 배치
- 따라 할 수 있는 코드베이스 예시 제공
- 참조할 수 있는 수동 케이스를 제공하여 다른 인풋 변환 작업에 활용하도록 함
- Claude에게 핸들을 줄 것
- 대부분의 사람들은 LLM을 부가적인 도구로만 활용하고 직접 개발 활동의 주도권을 가짐
- 그러나, Claude에게 올바른 형태의 입력값들을 제공하면, 한 번의 시도로 “원샷 원킬” 가능. 이는 LLM을 활용할 때 한 번에 하나씩 명령문을 입력하라는 일반적인 조언과는 다름
- 다만, 유의할 부분이 있음. 구체적인 요청을 주는 경우에는 제대로 작동할 수 있어도, 전반적인 문맥/목표를 알려주지 않고 구체적인 질문만을 할 경우, LLM이 계속 맬 가능성 존재
- Claude에 대한 기계적 공감을 할 것
- 갈수록 Claude가 할 수 있는 것과 할 수 없는 것에 대한 직관 생겨날 텐데, 이 구분을 아는 것이 중요
- 잘하는 부분: 많은 양의 코드를 변환, 재배치
- 못하는 부분: 버그를 두 번 만에 못 고치는 경우, 영원히 못 고친다는 것
- 앱 개발 중간중간 필요한 소도구를 만드는 데 활용할 것
-
- V. 소프트웨어 AI는 어디로 가고 있는가?
- 지난 몇 년간 소프트웨어 AI는 3가지 분야에 적용됨
- 영역 1. IDE 내 코드 자동생성 (ex. Github Copilot )
- 영역 2. StackOverflow에 올라온 프로그래밍 질문에 대한 답을 제공 (ex. ChatGPT)
- 영역 3. 여러 작업을 동시에 수행할 수 있었던 에이전트: 초기 데모는 존재했으나, 실용적으로 활용되지는 못함
- 이번 해부터 3가지 영역 모두에서 변화가 나타남
- 영역 1. Zed, Cursor 등의 IDE와 여러 VSCode 확장버전이 LLM을 통합하여, 더 나은 컨텍스트 제공, 더 많은 양의 코드 생성 처리
- 영역 2. 빠른 프로토타입, 단일-처리 코드 생성: Jupyter Notebook → Claude Artifact, ChatGPT Data Analyst
- 영역 3. Cognition, Factory, CodeGen와 같은 에이전트 스타트업 회사들이 소프트웨어 워크플로우 자동화 툴들을 만들어 나가고 있음
- 이 세 가지 영역이 고도화되고 합쳐지면서, “AI 엔지니어”가 나타날 것
- 자율적이고, 동시다발적, 연속적으로 활동하는 단일 시스템
- 혼자 작동하는 ‘자율 모드’ 또는 인간과 같이 작동하는 ‘페어 프로그래밍 모드'로 운영될 것
- 작동 1. 명확한 업무 과제들을 위한 ‘자율 모드’
- AI가 완전히 자율적으로 일하며, 코드 작성-실행, 외부 툴 활용, 웹에서 정보 탐색, 내부 문서 접근, 지난 오류로부터 학습
- 업무가 끝나거나 문제가 생길 때까지 계속 반복
- 업무의 단순하고 예측가능한 업무들은 서브-에이전트에게 전달
- 컴퓨팅 비용, 속도 개선
- 일의 80%
- 작동 2. 가장 어려운 업무 과제들을 위한 ‘페어 프로그래밍 모드’
- 인간이 전반적인 상황을 통제하지만, AI가 세부 수준의 실행 업무들을 담당함
- 두 가지 이상의 데이터 형태를 번갈아 가며 상호작용이 이뤄질 것
- 텍스트, 시각적 그래프, 대화를 통해 인간 - AI가 대화해가며, 서로의 코드를 변경
- 인간 또는 AI가 화면을 공유하며 AI 또는 인간이 수정 제안을 하는 시대가 옴
- “AI 엔지니어”는 인간 직원들이 알고 있는 회사의 지적재산권에 접근할 수 있을 것
- 지식 데이터베이스, 디자인 파일, 고객 데이터에 대한 정보를 볼 수 있게 됨
- 능동적인 역할을 맡아 더 나은 아이디어를 제안하기도 함
- 특정 업무에 대해서는 인간보다는 더 현명하지만, 일반론적인 상황을 이해하는 능력이 부족하거나, 방향 조정을 필요로 하는 경우가 발생할 수 있음 (PM, 매니저)
-
- VI. “AI 엔지니어”가 나타나도 여전히 인간 소프트웨어 엔지니어들이 필요한 이유
- 계산기가 발명되기 전에는 회계사들은 수동적인 계산 작업을 하는데 시간을 많이 활용
- 계산기가 그들의 직업을 없애지는 않았고, 더 추상적인 수준에서 업무들을 수행할 수 있게 해줌
- 아직도 수학, 컴퓨팅 방법론들을 익힐 필요는 있지만, 계산기-엑셀의 도움으로 더 많은 가치를 창출할 수 있게 됨
- 인간 엔지니어의 역할
- 큰 그림을 이해하여 우선순위 배정, 전반적인 구조를 이해하여 문제를 정의, AI의 작업물을 검토 — 시스템의 크기가 커질수록 중요
- 점점 “어떻게 만들어야 하는가” 보다는 “무엇을 만들 것인가”에 집중하게 될 것
- 문제의 “본질적인 복잡도”를 처리할 수 있는 꿈에 도달하고, 시스템의 “우연론적인 복잡성”에는 노출되지 않을 것
- 희망사항
- 무엇인가를 생성하는 유일한 진입장벽이 사람들의 창의력이 되는 세상 (I want to live in a world where people’s creativity is the only bottleneck to what they can create)
- 점점 소프트웨어 AI 툴들이 발전하며, 앞으로도 노코드 사례들이 계속 등장할걸로 예상합니다. 흥미로운 사례들을 계속 지켜보아 또 공유드릴 수 있도록 하겠습니다.
|
|
|
ChatGPT와 Claude가 새 스타트업들의 행렬을 불러올 이유
-
- I. 지난 몇 년간 가장 지배적인 소프트웨어 상품: 엑셀
- 엑셀이 좋은 상품인 이유: 초보자들이 시작하기에 쉬움 — 단순히 셀 안에 타이핑 하면 됨
- 고급 수준: 복잡한 금융 모델링, 데이터 분석, 비디오 게임의 시각화 요소 제작에 활용되기도 함
- [시작] 금융/회계 분야에서 활용 → [나중] 다양한 분야에서 활용하는 일반론적인 도구
-
- II. 엑셀로 촉발된 B2B SaaS 시장의 성장
- 엑셀 기반의 목적적합성 제품을 만들고 싶은 동기가 일어날 만큼의 광범위한 어돕션
- 엑셀을 활용하며 워크플로우를 개선 시켜나가고자 하는 상황 발생 (ex. 워크플로우 일부분 비효율적으로 운영, 특수 케이스에 맞춰져 기능을 업데이트 할 필요성 대두)
- 미시적인 관점에서 엑셀을 활용하려는 틈새 시장의 활성화 → $327B B2B SaaS 시장으로 성장
-
- III. 챗봇 앱(ex. ChatGPT, Claude, Gemini)이 촉발할 새로운 스타트업 행렬
- 챗봇 앱들은 엑셀과 유사하게 높은 수준의 접근성, 영향력 가짐
- 엑셀보다도 빠른 속도로 일반론적인 도구로 자리잡고 있음
- 소프트웨어 엔지니어들을 시작으로 현재는 챗봇 앱과 대화를 시도하는 탐험 단계
- 특수 업무 영역 워크플로우를 만들려는 시도가 많아질수록, 어떻게 하면 워크플로우의 비효율성을 개선할지에 대한 고민이 나타날 것
- 이러한 고민들을 직접적으로 해결하려는 시도들이 새로운 스타트업 행렬을 만들어 낼 것
-
- IV. 새로운 스타트업 행렬에 참여하기 위한 저자의 조언
- 어떤 식으로 본인, 타인이 챗봇을 활용하는지 탐색해 보기
- 계속 특정 행위를 반복해야만 좋은 결과물이 나온다는 점을 발견한다면, 그 반복 지점을 없애줄 수 있는 단일 앱을 만들어 볼 것
- 여러분들은 어떤 틈새 시장에 사업 기회를 보고 계신가요? 아직 생각한 바가 없다면, 일단은 Claude를 활용해 데모영상들을 따라하며 챗봇과 친숙해지는 것을 추천드립니다.
|
|
|
Digital Human
- 지금까지 데일리노트에서 다뤘던 로봇 소식들은 Disney가 만들어 내는 친근한 캐릭터 로봇, 웨어러블 Friend 목걸이 등, 인간의 심리적, 정신적 지원 역할을 하는 경우가 대부분이었습니다.
- 이번 장에서는 AI 기반의 사고구조에 인간의 신체적인 기능을 입히거나 탑재한 세 종류의 디지털 휴먼(Digital Human) 소식들을 전달 드리고자 합니다.
- AI 컴퓨터 비전 모델, 배터리, 전자기기, 센서, 작동기 등의 기술 연합체인 하드웨어 로봇
- 주요 기능
- 음성-음성 출력: 커스텀 AI 모델과 연결된 탑재 마이크와 스피커를 통해 실제 인간과의 대화 가능
- 카메라: 탑재된 6개의 RGB 카메라로 데이터를 입력받는 AI 컴퓨터 비전 시스템
- 손: 인간의 세밀한 움직임(16도의 움직임 범위), 동등한 힘을 가진 4세대 손
- 비전 언어 모델(VLM): 로봇 카메라의 시각적 추론을 통한 빠른 행동 출력
- 배터리: 2.25 KWh 커스텀 배터리 팩을 통해, 이전 버전 비해 50%+이상 에너지 절약
- CPU/GPU: 이전 버전 비해 3배의 컴퓨팅, AI 추론 능력
- 단순히 공을 받아 치는 쉬운 기능부터 상대편의 운동 패턴을 분석해 장기적인 승부 전략을 구상하는 복잡한 사고력을 탑재한 중급 아마추어 수준의 실력을 갖춘 탁구 로봇
- 로봇의 훈련 과정
- 사전 학습: 위치, 속도, 스핀 등과 관련된 탁구 움직임 상태
- 시물레이션 학습: 탁구 경기의 물리적 환경을 그대로 가져온 시뮬레이션 환경하에서 경기 진행
- 실제 인간과의 경기
- 초보부터 전문가까지 있는 총 29명의 초면인 인간 상대로 경기 진행
- 상대편 선수의 퍼포먼스를 기반으로 새로운 데이터 입력
- 다양한 움직임 구사 → 성공률 관찰 → 실시간으로 전략 조정 → 반복적인 피드백 회로를 통해 역량 강화
- 중간 수준의 경기력을 보였으며 고급 수준의 전문가를 이기지는 못함
- 한계점
- 반응 속도, 카메라 센스 역량, 스핀 핸들링, 시뮬레이션에서 모델링 하기 어려운 탁구와 공의 마찰 종류
- 의의
- 물리적 역량뿐만 아니라 전략적 의사결정과 같은 인지능력을 갖춘 디지털 인간을 개발하는데 스포츠가 좋은 학습 환경을 마련할 수 있다는 것을 증명함
- NVIDIA NIM, NVIDIA ACE, Elevenlabs 기술을 활용해 자연스러운 상호작용이 가능한 가상인간 로봇
- NVIDIA NIM & ACE: 고객 서비스 응대를 위한 똑똑하고, 상호작용 가능한 아바타 생성 툴킷
- Elevenlabs: 텍스트-음성 모델 서비스를 배포하는 AI 스타트업
- James의 주요 구성 요소
- 위의 세 사례를 볼 때, 앞으로 디지털 휴먼은 AI 정신 구조에 실제 몸체를 부여받거나 (ex. Figure 02, 탁구 로봇) 가상 몸체를 부여받는 (ex. 가상 아바타 James) 식으로 발전해 나갈 것임을 유추해볼 수 있습니다.
- AI 기반의 디지털 휴먼이 더 발전하면 앞으로 우리 사회에 어떤 변화가 나타날까요? 우리가 가장 기피하는 지저분하고 위험한 업무에만 동원될까요? 아니면, 정신과 신체가 항상 건강한 더 인간다운 로봇으로 발전할까요?
|
|
|
여러분의 참여를 환영합니다.
'데일리 노트' 뉴스레터는 독자들의 적극적인 참여를 전제로 기획되었습니다.
의견 남기기를 통해 여러분들의 이야기를 들려주세요. 뉴스레터 내용에 대한 의견, 다른 크리에이터분들에게 선보이고 싶은 제품/서비스, 공유하고 싶은 이야기, 협업하고 싶은 내용 모두 환영합니다. |
|
|
|