728x90
transformer를 공부하던 중 positional encoding부분에서 register_buffer라는 부분이 생소하여 포스팅으로 기록한다.

torch.nn.Module.register_buffer는 매개 변수로 간주되지 않는 버퍼를 등록하는 데 사용된다. register_buffer는 다음과 같은 특징이 있다.
- optimizer가 update하지 않는다.
- state_dict에는 저장된다.
- GPU에서 작동한다.
즉, 네트워크를 구성하는데 있어 중간에 업데이트를 하지 않는 일반 layer를 넣고 싶을 때 사용한다.

728x90
'딥러닝 > Pytorch' 카테고리의 다른 글
Pytorch 기본 예제 (0) | 2022.12.24 |
---|---|
tensor의 복사방법 (0) | 2022.08.06 |
pytorch - nn.function과 nn의 차이점 (0) | 2022.06.19 |
torch - GPU 사용하기 (0) | 2022.06.13 |
Pytorch nn.ModuleList (0) | 2022.05.30 |