데이터전처리3 파이썬 엑셀 열이름 통일법 엑셀 파일을 여러 사람과 주고받다 보면 같은 의미의 열인데 이름이 제각각인 경우가 많습니다. 어떤 파일은 “연락처”, 어떤 파일은 “휴대폰번호”, 또 어떤 파일은 “전화번호”로 되어 있어 같은 작업을 반복해도 코드가 자꾸 달라집니다. 이번 글에서는 이런 문제를 줄이기 위해 파이썬으로 열 이름을 바꾸고 통일하는 방법을 설명하겠습니다. 열 이름이 제각각이면 왜 작업이 자꾸 꼬이는가 엑셀 자동화를 처음 시작할 때는 데이터 내용만 맞으면 된다고 생각하기 쉽습니다. 하지만 실제로는 열 이름이 다르면 같은 파일처럼 보여도 처리 방식이 완전히 달라집니다. 예를 들어 고객 목록을 정리하는 작업에서 어떤 파일은 “연락처”, 어떤 파일은 “휴대폰번호”, 어떤 파일은 “전화번호”라는 열을 사용합니다. 사람은 이 셋이 같은.. 2026. 4. 6. 파이썬 엑셀 빈칸 정리법 엑셀 파일을 정리하다 보면 값이 비어 있는 셀 때문에 필터 결과가 달라지거나, 집계가 어긋나거나, 보고용 표가 지저분해지는 일이 자주 생깁니다. 특히 완전히 빈 행만 지우면 끝나는 것이 아니라, 특정 열의 빈칸만 걸러내거나 비어 있는 값을 일정한 기준으로 채워야 하는 경우가 많습니다. 이번 글에서는 이런 문제를 파이썬으로 어떻게 정리할 수 있는지 설명하겠습니다. 빈칸 때문에 엑셀 정리가 꼬이는 이유 엑셀에서 빈칸은 단순히 “값이 없다”는 의미로 끝나지 않습니다. 실제 업무에서는 빈칸 하나 때문에 데이터 분석 결과가 달라지기도 하고, 사람이 직접 파일을 검토할 때도 판단이 흔들리기 쉽습니다. 예를 들어 주문 내역 파일에서 고객명은 있는데 연락처가 비어 있거나, 거래처 목록에서 담당자 이름만 비어 있거나,.. 2026. 4. 6. 파이썬 불용어 제거, 중요한 단어가 사라질 때 해결 방법 프로젝트를 작업할 적에 상품명과 상세설명에서 핵심 키워드만 남기고 싶어서 불용어 제거를 먼저 적용했습니다. 그런데 실제로 돌려보니 잡음은 그대로 남고, 반대로 꼭 남아야 할 단어까지 같이 사라져 결과가 생각보다 좋지 않았습니다. 그래서 불용어를 무작정 지우는 방식에서 벗어나, 중요한 단어를 따로 보호하고 텍스트 정리 순서를 바꾸는 방식으로 수정했고, 그제야 쓸 만한 결과가 나왔습니다. 불용어 제거만으로는 해결되지 않았던 이유처음에는 불용어 목록만 잘 만들면 텍스트가 자연스럽게 정리될 것이라고 생각했습니다. 자주 등장하지만 의미가 약한 단어를 빼면 상품명과 상세설명에서도 핵심 키워드만 남을 것 같았기 때문입니다. 하지만 실제 데이터는 그렇게 단순하지 않았습니다. 문장 안에는 조사, 특수문자, 눈에 잘 띄.. 2026. 3. 23. 이전 1 다음