(논문 요약) SceneScript: Reconstructing Scenes With An Autoregressive Structured Language Model (Paper)
핵심 내용
- 목표: 방안을 돌아다니며 수집한 영상 데이터로 건축 구조를 코드화 하여 모델링.
데이터: Aria Synthetic Environments (100k indoor scenes, photorealistic and ground-truth annotated renders of egocentric scene walkthroughs)
- 방법
- (1) point cloud 나 image sequence 를 encode.
- (2) autoregressive decoder 의 input 으로 넣음.