데이터 과학자를위한 10 가지 리눅스 명령 :

2019. 8. 11. 20:30

독서 시간 : 3 분

Linux / Unix는 개발 및 분석에 가장 많이 사용되는 플랫폼입니다. 나는 리눅스의 기본 명령에서 많은 개발자와 데이터 과학자의 투쟁을 보았지만 실제로는 매우 쉽지만 게으름이 적기 때문에 문서화하는 것을 무시한다. 이 기사를 살펴 보는 데 단 5 분이 소요됩니다.이 기사에서“데이터 과학자를위한 10 가지 Linux 명령”을 참조하십시오. 가장 큰 장점은 명령 목록 중 10 개만 가장 많이 나열한 것입니다. 나는 항상 큰 성공을위한 작은 발걸음을 믿습니다. 나는 데이터 과학자이며 그것이 가장 큰 고통의 영역이었다. 따라서 나는이 기사에서 그것들을 문서화했다. 당신이 생각하면 쉽게 표시를 예약 할 수 있습니다.

데이터 과학자를위한 10 가지 리눅스 명령 :

찾기 –

이 명령은 디렉토리에서 파일을 검색하는 데 도움이됩니다. 재귀 적으로 검색합니다. 다음은 그 구문입니다.

find [Directory] [regular_expression] [-options] [search_type]

➜ 등을 찾으십시오. -name '* trans *'-타입 f ./filetransfer.txt

2. grep –

파일을 찾으면. 이제 파일 내에서 패턴을 검색해야합니다. grep 명령을 사용할 수 있습니다. 이 검색을보다 효과적으로 만드는 많은 옵션이 있습니다. 하나씩 이해하십시오.

통사론: grep "WhatToSearch"파일 이름

변형 –

노트 -

문자열 (WhatToSearch) 및 filename 대신에 정규식을 사용할 수 있습니다.
기본적으로 grep 명령은 대소 문자를 구분합니다. 대소 문자를 구분하지 않으려면“grep -i”를 사용하십시오. 예를 들어 –

cut -d ','-f 5 filename.csv

grep -i "whatToSearch"파일 이름

grep 명령에 대한 자세한 정보를 얻으십시오 .

3. 컷 –

빠른 필터링에 매우 유용합니다. 열 데이터를 사용하면 최상의 결과를 얻을 수 있습니다.

cut -d 'separator'-f column_no 파일 이름cut -d ','-f 5 filename.csv

4. Wget 명령 –

원격 위치에서 무언가를 다운로드해야하는 경우이 명령을 사용하십시오. 다음은 간단한 구문입니다.

~ $ wget taget_link

5. 역사

우리는 이런 상황에 직면해야하며 우리는 어떤 명령에 대해 말했지만 그 명령은 스크린에서 사라진다. 다시 사용해야 할 때 검색합니다. 스마트 솔루션은이를위한 사용 내역 명령입니다.

~ $ 역사

6. 머리 –

종종 우리는 파일의 구조를 볼 필요가있다. 우리는 단지 파일의 일부를 인쇄하기 위해 파일을 열 필요는 없다. 일반적으로 csv / excel 유형의 파일 헤더를 볼 필요가 있습니다. 대부분의 분석 소프트웨어에서 열 이름은 file로 매핑해야합니다. 다음에이 시나리오를 사용하십시오. head 명령의 구문은 다음과 같습니다.

~ $ head -n 5 파일 이름

여기서 n의 값은 header의 행 번호를 나타냅니다.

7. 꼬리 –

head 명령과 매우 유사하지만 본질적으로 반대입니다. 기본적으로 마지막부터 인쇄됩니다. 구문은 아래를 참조하십시오.

꼬리 -n 15 파일 이름

8. awk –

학습을위한 완전한 주제입니다. 진실은 그것을 인라인으로 덮고있는 것입니다. 여기에 큰 불의가있을 것입니다. Awk는 텍스트 파일을 특수하게 처리하고 필터링합니다. this (awk)에 대한 자세한 내용은 here 참조해야한다고 생각합니다 .

9. 화장실 –

이 Linux 명령 / 쉘 명령은 데이터 과학자가 파일 아래 줄 수, 단어 수를 찾거나 추정하는 데 도움이됩니다.

예를 들어 –

$ wc -l filename.txt

여기서 wc -l은이 파일의 행 번호를 나타냅니다. 파일 내부의 단어 수를 추정하려면 다시 한 번. 방법은 다음과 같습니다

$ wc -w filename.txt

도 10. 고양이 –

목록의 끝에 있지만 목록에는 없습니다. 사실 그것은 우리에게 가장 인기있는 명령 중 하나입니다. cat 명령을 사용하여 모든 파일의 내용을 인쇄합니다. 이와 함께이 명령을 사용하여 두 파일을 하나로 병합 / 연결할 수 있습니다. cat 명령의 구문은 다음과 같습니다.

cat input1.csv input2.data> output.csv

이것은 데이터 과학자로서 저에게 가장 필요한 명령입니다. 나는 당신에게도 똑같이되기를 바랍니다. 그것은 거의 매일 80 % 리눅스 물건을 마무리합니다.

결론 –

언젠가이 작은 학습은 많은 도움이됩니다. 우리가 무언가를 배우거나 배우기로 결정할 때 일반적으로 일어나는 일. 우리는 최고의 튜토리얼을 찾기 위해 시간을 투자합니다. 우리는 일반적으로 자세한 것을 얻지 만 시작하지는 않습니다. 언젠가 우리는 시작하기는하지만 우리에게 큰 것처럼 보이기 때문에 일찍 멈 춥니 다. 이 기사는 튜토리얼 내용은 아니지만 실제로 작은 단계를 수행하는 마음가짐입니다. 이것에 대한 당신의 의견을 알려주세요. 나는이 사고 방식을 의미한다. 이 기사가 당신의 성과에 영향을 주나요? 알려주세요. 위에서 언급 한 명령과 관련하여 의문이있는 경우 다시 작성해주십시오.

코딩용가리

데이터 과학자를위한 10 가지 리눅스 명령 :

데이터 과학자를위한 10 가지 리눅스 명령 :

2. grep –

3. 컷 –

4. Wget 명령 –

5. 역사

6. 머리 –

7. 꼬리 –

8. awk –

9. 화장실 –

도 10. 고양이 –

결론 –

+ Recent posts

티스토리툴바