728x90
네이버 파파고를 사용해서 번역을 개발하고 있는데
< > 안에 한글이 있는 경우 태그로 인식해서 번역을 안하는 오류를 발견했다.
이럴 경우 < 는 <로 >는 > 로 변환해서 번역을 해야할 것
같아서 함수를 만들어봤다.
입력된 문장에서 한글이 들어가 있는 < > 를 발견하면 html entities로 변환해주는
함수이다.
import re
def prePrecessing(text):
# 한글이 포함된 <와 >를 찾는 정규식 패턴
pattern = re.compile(r'(<[^>]*[가-힣]+[^<]*>)')
# 한글이 포함된 <와 >를 <와 >로 변환
def replace_brackets(match):
return match.group(0).replace('<', '<').replace('>', '>')
# 변환된 문자열 반환
return pattern.sub(replace_brackets, text)
# 예시 텍스트
text = "이것은 <b>한글</b> <텍스트> 입니다. 그리고 이것은 <영어> 텍스트입니다."
# 변환된 텍스트 출력
converted_text = prePrecessing(text)
print(converted_text)
반응형
'파이썬' 카테고리의 다른 글
파이썬에서 mysql 연동하기 (0) | 2024.11.21 |
---|---|
GET, POST 사용하기 - Requests (1) | 2024.08.30 |
Papago Website Translation 샘플소스 (2) | 2024.08.29 |
파이썬에서 url encode, decode 하는 방법 (1) | 2024.08.29 |
문자열 공백제거 함수 - 파이썬 (57) | 2024.08.12 |