이번에 다룰 자료형은 집합 자료형이다. 집합(set)은 Python 2.3부터 지원하기 시작한 자료형으로, 집합에 관련된 것을 쉽게 처리하기 위해 만든 자료형이다.
집합 자료형은 set 키워드를 사용해 만들 수 있다. set()의 괄호 안에 리스트를 입력해서 만들거나 문자열을 직접 입력해 만들 수도 있다. 비어 있는 집합 자료형은 s = set()로 만들 수 있다.
>>> s1 = set([1, 2, 3])
>>> s1
{1, 2, 3}
>>> s2 = set("Hello")
s2
{'e', 'H', 'l', 'o'}
set에는 아래와 같은 2가지 큰 특징이 있다.
중복을 허용하지 않는 set의 특징을 이용해서 데이터의 중복을 제거하기 위한 역할로 집합 자료형이 종종 사용된다.
리스트나 튜플은 순서가 있어(ordered) 인덱싱을 통해 자료형의 값을 얻을 수 있지만, set과 딕셔너리 자료형은 순서가 없어(unordered) 인덱싱으로 값을 얻을 수 없다. set 자료형에 저장된 값을 인덱싱으로 접근하려면 리스트나 튜플로 변환 후 인덱싱을 사용해야 한다.
>>> s1 = set([1, 2, 3])
>>> l1 = list(s1) # 리스트로 변환
>>> l1
[1, 2, 3]
>>> l1[0]
1
>>> t1 = tuple(s1) # 튜플로 변환
>>> t1
(1, 2, 3)
>>> t1[0]
1
아래와 같은 두 set 자료형이 있다고 해 보자.
>>> s1 = set([1, 2, 3, 4, 5, 6])
>>> s2 = set([4, 5, 6, 7, 8, 9])
'&' 기호를 사용하면 교집합을 간단히 구할 수 있다. 혹은 intersection 함수를 이용해도 된다.
>>> s1 & s2
{4, 5, 6}
>>> s1.intersection(s2)
{4, 5, 6}
>>> s2.intersection(s1)
{4, 5, 6}
합집합은 '|' 기호나 union 함수를 통해 구할 수 있다. 중복된 값은 한 개씩만 표현된다.
>>> s1 | s2
{1, 2, 3, 4, 5, 6, 7, 8, 9}
>>> s1.union(s2)
{1, 2, 3, 4, 5, 6, 7, 8, 9}
>>> s2.union(s1)
{1, 2, 3, 4, 5, 6, 7, 8, 9}
차집합은 '마이너스(-)' 기호나 difference 함수를 사용해서 구할 수 있다.
>>> s1 - s2
{1, 2, 3}
>>> s2 - s1
{8, 9, 7}
>>> s1.difference(s2)
{1, 2, 3}
>>> s2.difference(s1)
{8, 9, 7}
이미 만들어진 set 자료형에 값을 추가할 수 있다. 1개의 값을 추가할 수 있다.
>>> s1 = set([1, 2, 3])
>>> s1.add(4)
>>> s1
{1, 2, 3, 4}
값을 여러 개 한꺼번에 추가(update)할 때 사용한다.
>>> s1 = set([1, 2, 3])
>>> s1.update([4, 5, 6])
>>> s1
{1, 2, 3, 4, 5, 6}
>>> s1 = set([1, 2, 3])
>>> s1.remove(2)
>>> s1
{1, 3}
[ Python 기초 문법 ] - 자료형의 값을 저장하는 공간, 변수 (0) | 2023.08.06 |
---|---|
[ Python 기초 문법 ] - 자료형(7) - 불 자료형 (0) | 2023.08.05 |
[ Python 기초 문법 ] - 자료형(5) - 딕셔너리 자료형 (0) | 2021.02.27 |
[ Python 기초 문법 ] - 자료형(4) - 튜플 자료형 (0) | 2021.02.27 |
[ Python 기초 문법 ] - 자료형(3) - 리스트 자료형 (0) | 2021.02.27 |
댓글 영역