반응형
중복 행 선택(거의)
내 테이블은 다음과 같습니다.
| id (int) | sentence (varchar) |
특정 단어 하나를 제외하고 거의 동일한 모든 행을 찾고 싶습니다.예:
| 230 | test |
| 321 | test sth |
...
| 329 | is (sth) it?
| 923 | is it?
다를 수 있는 단어는 이 경우 무언가입니다.이상적으로 저는 다른 단어 목록과 함께 일종의 배열을 사용할 수 있습니다.
이것이 제가 순수하게 SQL에서 할 수 있는 일인가요?
검증되지 않은 빠른 촬영이었어요, 미안하지만 당신이 할 수 있는 일은
SELECT * FROM table GROUP BY REPLACE(text, 'sth', '')
사용가능SOUNDEX
. 예를 들어, 다음과 같은 쿼리를 제공합니다.
SELECT SOUNDEX('test')
SELECT SOUNDEX('test sth')
SELECT SOUNDEX('is (sth) it?')
SELECT SOUNDEX('is it?')
다음 결과를 반환합니다.
T230
T230
I200
I200
그것은 첫번째 두개와 두번째 두개의 소리가 서로 비슷하다는 것을 의미합니다.제가 확신할 수 없는 것은 이것이 실제 데이터와 얼마나 잘 작동할 것인가 하는 것입니다. 단지 시도해보기만 하면 될 것입니다.
언급URL : https://stackoverflow.com/questions/22992224/selecting-almost-duplicate-rows
반응형
'it-source' 카테고리의 다른 글
대량 삽입 기능이 있는 AWS RDS의 네트워크 성능 문제 (0) | 2023.09.13 |
---|---|
열에 고유한 제약 조건이 있는지 검색 (0) | 2023.09.13 |
xml.etree를 사용합니다.요소형식이 양호한 xml 파일을 인쇄할 트리 (0) | 2023.09.13 |
Oracle SQL의 조건부 SUM (0) | 2023.09.13 |
jQuery, 단순 폴링 예제 (0) | 2023.09.13 |