'전체 글'에 해당되는 글 579건

  1. 2025.07.18 [Ghidra] Unicode String 유니코드 문자열 인식 1
반응형

기드라에서 인식하지 못하는 유니코드 문자열을 인식시켜 보자.

 

Music_Player.zip
9.52MB

 

x64dbg로 분석 시 제대로 인식되는 유니코드 문자열이 있다.

 

이 부분을 Ghidra로 분석해 보면 문자열이 인식되지 않는다.

 

문자열 코드로 이동한다. 함수로 인식되어 있다.

 

문자열 부분을 모두 선택하고 우클릭 - Clear - Clear Code Bytes를 클릭한다.

 

 

함수로 인식됐던 내용이 삭제되면 다시 우클릭 - Data - TerminatedUnicode 클릭

 

유니코드 문자열로 제대로 인식됐다.

 

디스어셈블리에서도 제대로 인식된다.

 

사실 x64Dbg에서도 문자열 코드의 디스어셈블리 내용을 보면 문자열로 인식되지는 않는다.

 

※ 참고

0x00402bac의 문자열 부분 Hex Code 는 아래와 같다.

310084BD2000F8BBACB9E3B430AECCB9200000ACA5B269D5C8B2E4B22E00

 

유니코드는 한 문자가 2바이트로 구성되며 Little Endian 방식이므로 뒤집어서 해석해야 한다.

예를 들어 '분'이라는 글자는 유니코드로 bd84이지만 Hex Code에는 84bd로 저장되어 있다.

 

그러므로 '1분 미리듣기만 가능합니다.'의 유니코드는 아래와 같다.

0x0031 0xbd84 0x0020 0xbbf8 0xb9ac 0xb4e3 0xae30 0xb9cc 0x0020 0xac00 0xb2a5 0xd569 0xb2c8 0xb2e4 0x002e

 

이 링크에서 위 유니코드를 Input에 입력하면 변환된 문자열을 확인 할 수 있다.

 

 

 

반응형
Posted by J-sean
: