About
2025.02.24.
U_Net_Base/exp2
U-Net-based latent injection code
- Net1d: 16 x 32 x 64 → conv2d → 256 x 32 x 64
- PixelEstimate: 256 x 32 x 64 → Aver. → 4 x 32 x 64 → conv2d → 64 x 16 x 32 (Maintain # elements)
- Channel_Inc: 64 → conU-Net-basedv2d → 512
- FiLM (Mic angle, distance) 512 x 2
- U-Net: x5 ← concat(x5, latent), others: remain
Problem
- 16 x 32 latent size 가 너무 작을 수도 있음.
- Net1d에서 채널을 과하게 늘림
- PixelEstimate에서 Aver.해서 Net1d의 채널 늘린 영향을 방해함
- Channel_Inc에서 채널을 과하게 늘림
- U-Net의 Expansion path에 latent를 더 넣어줘야 함. (Contracting path는 고민중)
Future Work
- Net1d: 16 x 32 x 64 유지
- PixelEstimate:
- 16 x 32 x 64 → conv2d → 16 x 16 x 32
- 16 x 32 x 64 → conv2d → 16 x 32 x 64 (headroom issue assert)