독서 시간 : 3 분
Linux / Unix는 개발 및 분석에 가장 많이 사용되는 플랫폼입니다. 나는 리눅스의 기본 명령에서 많은 개발자와 데이터 과학자의 투쟁을 보았지만 실제로는 매우 쉽지만 게으름이 적기 때문에 문서화하는 것을 무시한다. 이 기사를 살펴 보는 데 단 5 분이 소요됩니다.이 기사에서“데이터 과학자를위한 10 가지 Linux 명령”을 참조하십시오. 가장 큰 장점은 명령 목록 중 10 개만 가장 많이 나열한 것입니다. 나는 항상 큰 성공을위한 작은 발걸음을 믿습니다. 나는 데이터 과학자이며 그것이 가장 큰 고통의 영역이었다. 따라서 나는이 기사에서 그것들을 문서화했다. 당신이 생각하면 쉽게 표시를 예약 할 수 있습니다.
데이터 과학자를위한 10 가지 리눅스 명령 :
- 찾기 –
이 명령은 디렉토리에서 파일을 검색하는 데 도움이됩니다. 재귀 적으로 검색합니다. 다음은 그 구문입니다.
find [Directory] [regular_expression] [-options] [search_type]
➜ 등을 찾으십시오. -name '* trans *'-타입 f ./filetransfer.txt
2. grep –
파일을 찾으면. 이제 파일 내에서 패턴을 검색해야합니다. grep 명령을 사용할 수 있습니다. 이 검색을보다 효과적으로 만드는 많은 옵션이 있습니다. 하나씩 이해하십시오.
통사론: grep "WhatToSearch"파일 이름
변형 –
노트 -
- 문자열 (WhatToSearch) 및 filename 대신에 정규식을 사용할 수 있습니다.
- 기본적으로 grep 명령은 대소 문자를 구분합니다. 대소 문자를 구분하지 않으려면“grep -i”를 사용하십시오. 예를 들어 –
cut -d ','-f 5 filename.csv
grep -i "whatToSearch"파일 이름
grep 명령에 대한 자세한 정보를 얻으십시오 .
3. 컷 –
빠른 필터링에 매우 유용합니다. 열 데이터를 사용하면 최상의 결과를 얻을 수 있습니다.
cut -d 'separator'-f column_no 파일 이름cut -d ','-f 5 filename.csv
4. Wget 명령 –
원격 위치에서 무언가를 다운로드해야하는 경우이 명령을 사용하십시오. 다음은 간단한 구문입니다.
~ $ wget taget_link
5. 역사
우리는 이런 상황에 직면해야하며 우리는 어떤 명령에 대해 말했지만 그 명령은 스크린에서 사라진다. 다시 사용해야 할 때 검색합니다. 스마트 솔루션은이를위한 사용 내역 명령입니다.
~ $ 역사
6. 머리 –
종종 우리는 파일의 구조를 볼 필요가있다. 우리는 단지 파일의 일부를 인쇄하기 위해 파일을 열 필요는 없다. 일반적으로 csv / excel 유형의 파일 헤더를 볼 필요가 있습니다. 대부분의 분석 소프트웨어에서 열 이름은 file로 매핑해야합니다. 다음에이 시나리오를 사용하십시오. head 명령의 구문은 다음과 같습니다.
~ $ head -n 5 파일 이름
여기서 n의 값은 header의 행 번호를 나타냅니다.
7. 꼬리 –
head 명령과 매우 유사하지만 본질적으로 반대입니다. 기본적으로 마지막부터 인쇄됩니다. 구문은 아래를 참조하십시오.
꼬리 -n 15 파일 이름
8. awk –
학습을위한 완전한 주제입니다. 진실은 그것을 인라인으로 덮고있는 것입니다. 여기에 큰 불의가있을 것입니다. Awk는 텍스트 파일을 특수하게 처리하고 필터링합니다. this (awk)에 대한 자세한 내용은 here 참조해야한다고 생각합니다 .
9. 화장실 –
이 Linux 명령 / 쉘 명령은 데이터 과학자가 파일 아래 줄 수, 단어 수를 찾거나 추정하는 데 도움이됩니다.
예를 들어 –
$ wc -l filename.txt
여기서 wc -l은이 파일의 행 번호를 나타냅니다. 파일 내부의 단어 수를 추정하려면 다시 한 번. 방법은 다음과 같습니다
$ wc -w filename.txt
도 10. 고양이 –
목록의 끝에 있지만 목록에는 없습니다. 사실 그것은 우리에게 가장 인기있는 명령 중 하나입니다. cat 명령을 사용하여 모든 파일의 내용을 인쇄합니다. 이와 함께이 명령을 사용하여 두 파일을 하나로 병합 / 연결할 수 있습니다. cat 명령의 구문은 다음과 같습니다.
cat input1.csv input2.data> output.csv
이것은 데이터 과학자로서 저에게 가장 필요한 명령입니다. 나는 당신에게도 똑같이되기를 바랍니다. 그것은 거의 매일 80 % 리눅스 물건을 마무리합니다.
결론 –
언젠가이 작은 학습은 많은 도움이됩니다. 우리가 무언가를 배우거나 배우기로 결정할 때 일반적으로 일어나는 일. 우리는 최고의 튜토리얼을 찾기 위해 시간을 투자합니다. 우리는 일반적으로 자세한 것을 얻지 만 시작하지는 않습니다. 언젠가 우리는 시작하기는하지만 우리에게 큰 것처럼 보이기 때문에 일찍 멈 춥니 다. 이 기사는 튜토리얼 내용은 아니지만 실제로 작은 단계를 수행하는 마음가짐입니다. 이것에 대한 당신의 의견을 알려주세요. 나는이 사고 방식을 의미한다. 이 기사가 당신의 성과에 영향을 주나요? 알려주세요. 위에서 언급 한 명령과 관련하여 의문이있는 경우 다시 작성해주십시오.