728x90

IT 417

[python] matplotlib 사용법 기초

matplotlib는 figure이나 subplot등이 어떻게 움직이는지 알기 어렵다. 따라서 이번 포스팅을 통해 matplotlib의 구조에 대해서 간략하게 정리하고자 한다. 포스팅은 내용은 기본적으로 matplotlib.pyplot을 import된 상태라는 가정하에 설명하고 있다. import matplotlib.pyplot as plt plt.figure() plt.figure()이 맨 처음에 나오는 경우가 많다. figure()은 Figure인스턴스를 생성하는데 Figure인스턴스의 역할은 이미지 전체의 영역을 확보하는 것이다. 인수로 아래와 같은 항목을 지정할 수 있다. figsize : (width, height)의 튜플을 전달한다. 단위는 인치이다. dpi : 1인치당의 도트 수 faceco..

IT/언어 2021.08.09

[python] 데이터 사이언티스트(데이터 분석가)에 도움이 되는 Tip : yield, partial, map, filter, reduce, enumerate

※ 일본 포스팅을 번역한 것입니다. 오역 및 직역이 있으며 내용의 오류가 있는 경우 댓글로 알려주시면 수정하겠습니다. 책 Data Science from Scratch 챕터 2에서 나온 일부의 내용을 내가 필요할 때 보기위해 정리한 메모이다. yield yield에 대한 이미지는 이 포스팅에서 잘 다루고 있다. 그 다음 이 포스팅을 읽는다면 더욱 이해가 깊어질 것이다. 여기서 yield에 대해 한 문장으로 간략하게 말하자면, "return을 사용하면 그 행에서 처리가 끝나 값을 모두 return하게 되므로, 거대한 데이터를 이용해서 반복 작업을 할 경우, 반복할 때마다 메모리를 쓸모없이 낭비하게 된다. 이때, yield을 사용하면 편리하다"라고 할 수 있다. def func(): a = 10 b = 20..

IT/AI\ML 2021.08.03

[python] ArgumentParser 사용법

개요 Python의 실행시에 커맨드 라인 인수를 다룰 때, ArgumentParser(argparse)를 사용하면 편리하다. 다양한 형식으로 인수를 지정하는 것이 가능하다. 처음에 argparse를 사용할 생각으로 여러가지 포스팅을 살펴보았지만, 자세한 옵션까지 설명하고 있는 포스팅이 많아서 간단한 사용법을 알기 어려웠기 때문에 여기서는 간단하게 바로 시작할 수 있는 필요한 최소한의 내용에 대해 정리하고자 한다. ArgumentParser이란? 프로그램을 실행시에 커맨드 라인에 인수를 받아 처리를 간단히 할 수 있도록 하는 표준 라이브러리이다. ArgumentParser를 사용하면, $ python program.py test.txt --alpha 0.01 위와 같이, 프로그램에서 처리할 수 있는 파일명..

IT/언어 2021.08.02

[python/Tensorflow] TFRecord를 만들어서 최소한의 CIFAR-10데이터로 학습시키기

이전에 번역했던 TFRecord포스팅보다 조금 더 알기 쉬운 일본 블로그 포스팅을 발견해서 번역해서 정리해두고자 한다. 1. TFRecord에 대해 TFRecord가 종종 나오지만, 비교적 입문하기 어렵기 때문에 방치하는 경우가 많다. 이번에는 CIFAR-10를 스스로 만든 TFRecord를 경유해서 학습시켜 보도록 하겠다. Numpy베이스로 할 수 있는 최소한의 처리를 TFRecord로 작성한다. TFRecord가 무엇인가에 대한 이야기부터 하자면, TFRecord는 Tensorflow가 장려하고 있는 머신러닝 데이터 포맷이다. 포맷은 Protocol Buffer가 베이스이다. 2. Numpy 배열을 기록하기 위해서는 TFRecord는 다양한 작성 방법이 있지만, 처음에는 "어떤 방법으로 작성하면 좋을..

IT/AI\ML 2021.07.30

[python] python으로 excel을 조작할 수 있는 openpyxl 사용법

excel 파일을 python으로 다룰 수 있는 openyxl 패키지에 대한 내용과 기본적인 사용법을 정리해보았다. 우선 OpenPyXL 문서는 여기서 확인이 가능하다. OpenPyXL이란 OpenPyXL은 Excel 파일을 읽고 쓰기를 Python으로 할 수 있는 일종의 모듈이다. 예를 들어 아래와 같은 조작이 가능하다. - 셀 번호를 지정해서 이미지나 문자열을 입력할 수 있다. - Excel 파일의 시트 데이터를 복사해서 다른 시트에 붙여넣기 할 수 있다. - 시트를 추가하거나 삭제할 수 있다. 다만 이 모듈을 사용하기 위해서 주의해야할 점이 한 가지가 있는데 바로 확장자가 ".xlsx"여야한다는 것이다. 이번 포스팅에서는 정말 기초적인 방법만 다루도록 하겠다. OpenPyXL 설치법 다른 패키지나 ..

IT/언어 2021.07.27

[논문] 새로운 활성화함수 "FReLU" 탄생과 해설

※ 일본 블로그의 포스팅을 해석한 것입니다. 오역이나 직역이 있을 수 있으며, 내용 오류는 댓글로 알려주시면 수정하도록 하겠습니다. 이미지 인식에 특화된 새로운 활성화 함수 FReLU 해설과 구현 뉴럴 네트워크의 비선형성을 받쳐주고 있는 활성화 함수이지만, 현재 사실상의 표준으로 ReLU만 언급되고 있다. 심플하고 강력한 ReLU에 대적할 새로운 활성화 함수로써 Swish[Ramachandran, P.(2017)]나 Mish[Misra, D.(BMVC'20)] 제안되었지만, 최근(2020년 10월)에 이미지 인식에 특화된 활성화 함수로 등장해 ECCV'20에 채택된 Funnel Activation (통칭 FReLU)가 두각을 나타내고 있다. 이미지 분류나 물체 검출, 시멘틱 세그멘테이션등의 분야 등에 성..

IT/AI\ML 2021.07.25

머신러닝에서의 IoU(Intersection over Union)란?

IoU란? IoU는 Intersection over Union의 약어로 머신러닝의 물체검출 분야에서 2개의 영역이 "얼마나 겹쳐져 있는가"를 표시하는 지표이다. 물체 검출의 평가지표인 IoU IoU는 물체 검출 분야에서 평가지표로 사용된다. 여기서 물체 검출이란 "이미지"와 정답 라벨(어느 영역에 어떤 것이 있는가에 대한 정보)가 전달될 때, 이것을 얼마나 정확하게 검출하는가에 대한 문제이다. 정답 영역 및 예측 영역은 대부분 직사각형으로 하는 문제 설정이 많다. 정답 영역과 예측 영역이 겹쳐진 부분이 클 수록 IoU의 값이 커진다. 예측 영역이 어긋나거나, 정답 영역내에서도 너무 작은 영역이 겹친다거나 정답 영역에 포함되어 있어도 너무 크면 IoU의 값이 낮아진다. 즉, IoU의 값이 클수록 "물체가 ..

IT/AI\ML 2021.07.19

[python/pandas] DataFrame 합치기 : merge, join(열, 인덱스 기준)

날짜나 이름등 공통 데이터 열을 가지고 있는 여러 개의 pandas.DataFrame을 그 공통된 열을 기준으로 결합하기 위해서는 pandas.merge()함수 혹은 pandas.DataFrame의 merge()메소드를 사용한다. 인덱스 열을 기준으로 결합할 경우에는 pandas.merge()를 사용할 수 있고, pandas.DataFrame의 join()메소드도 사용할 수 있다. 이 포스팅에서는 아래의 내용에 대해 설명하고자한다. pd.merge(), pd.DataFrame.merge()의 기본적인 사용법 키가 되는 열을 지정: 인수on, left_on, right_on 결합 방법을 지정: 인수how inner_join: how='inner' left_join: how='left' right_join:..

IT/언어 2021.07.13

[python] python으로 csv파일 읽어들이기

python으로 csv파일을 읽어들이는 방법과 다루는 방법에 대해 간단하게 소개하고자 한다. csv 먼저 python의 표준 라이브러리의 csv를 사용해보자. 읽어들이기 csv를 사용하여 csv파일을 읽어 들일 수 있다. import csv csv_file = open("./TEST_STOCK.csv", "r", encoding="ms932", errors="", newline="" ) #리스트 형식 f = csv.reader(csv_file, delimiter=",", doublequote=True, lineterminator="\r\n", quotechar='"', skipinitialspace=True) #사전형 형식 f = csv.DictReader(csv_file, delimiter=",", d..

IT/언어 2021.07.08

[python/Tensorflow2.x] TFRecord의 사용법

TFRecord란? TFRecord는 데이터 세트의 포맷의 하나로 TFRecord형식은 바이너리 코드의 시리즈를 저장하기 위한 단순한 형식이다. 프로토콜 버퍼는 구조화 데이터를 효율적으로 시리얼라이즈하는 플랫폼이나 언어에 의존하지 않는 라이브러리이다. TFRecord를 사용하는 것으로, 대규모 데이터를 효율적으로 학습할 수 있게 된다. 이번 포스팅을 통해 TFRecord의 사용 방법이나 마스터할 수 있도록 읽고 쓰기하는 방법에 대해 살펴 볼 것이다. 그리고 마지막으로 실제 예를 이용해서 어떻게 사용할 수 있는지에 대해서 알아볼 것이다. TFRecord를 사용하는 이유 TFRecord 안은 Protocol Buffer이라는 바이너리 포맷으로 되어 있다. 한 번 TFRecord를 작성하는 것으로 데이터의 생..

IT/AI\ML 2021.07.08
728x90