Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- s3
- embodied
- Rust
- airflow
- GPT
- bricksassistant
- video understanding
- 디스코드챗봇
- vision-language navigation
- ChatGPT
- 디스코드
- Hexagonal Architecture
- crwaling
- Golang
- bitcoin
- embodied ai
- Ai
- blockchain
- 챗봇
- vln
- frontend
- MLFlow
- Spark
- 블록체인
- datahub
- backend
- discord
- 디스코드봇
- databricks
- data discovery
Archives
- Today
- Total
목록video understanding (1)
BRICKSTUDY
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/JruZb/btsIODaVAOd/k4u9wbhAlPZoEnMq46xCIk/img.png)
안녕하세요 박찬영입니다. 최근 video 관련 연구 분야에 대한 작은 관심이 생겨서 프로젝트 주제를 선정하기도 했는데, 연구적인 호기심이 강해서 서비스보다는 연구 위주로 먼저 생각해보려고 오늘의 주제를 가져왔습니다.오늘의 주제는 "Video Understanding"이라는 연구 분야에 대해서 세부적으로 어떤 Task들이 있는지 알아보고, 계속해서 관심을 받고 있는 LLM과 같이 활용하는 방법들을 소개하려고 합니다. 전체적인 내용은 서베이 논문인, Tang, Yunlong, et al. "Video understanding with large language models: A survey." _arXiv preprint arXiv:2312.17432_ (2023). 해당 논문을 보고 작성했습니다.어려운 내..
프로젝트
2024. 7. 28. 10:10