Sunday, July 17, 2016

무역 전략 데이터 마이닝






+

데이터 마이닝 - FX 데이터 마이닝에 대한 소개의 가장 흥미로운 분야 중 하나 오늘 간단하고 빠른 도입을 만들어 보자. 데이터 마이닝 다양한 애플리케이션이있다. 우리는 우리의 FX 거래에서 데이터 마이닝을 통합해야합니다. FX는 FOREX 또는 외환 FX는 매일 거래 볼륨의 측면에서 가장 큰 시장이다. 큰 소년, 중간 레벨과 당신과 나 같은 간단한 상인 : 그것은 참가자의 세 가지 수준이 있습니다. 우리가 물건을 교환하지 않는 대부분의 시간을 의미 투기 적 성격을 가지고 있습니다. 우리는 차에만 신경과 낮은 구매 및 높은 판매하거나 높은 판매와 낮은 구매하고 싶습니다. 짧거나 긴 작업으로 우리는 주사위를 얻을 수 있습니다. 당신의 거래량에 따라 핍 값은 1 센트에서 10 이상으로 다양합니다. 이것은 FX 시장 (캐리 무역, 중개, 차익 등을 통해 함께) 돈을 벌 수있는 주요 방법입니다. 외환 시장이 거대하지만 선수의 모든 수준에 적합 함을 알 수 있습니다. 제품 및 고객의 무한한 수의 무한 슈퍼마켓으로 외환 시장의 생각하지만, 그것은 또한 출납원의 무한한 수있다. 이 의미하는 것은 모두를위한 기회의 동일한 금액입니다. 데이터 마이닝과 기계 학습 데이터 마이닝은 컴퓨터 과학의 성숙 서브 필드입니다. 그것은 데이터 및 방대한 양의 데이터에서 유용한 지식이 아닌 사소한 추출 많은 대해이야. 이것은 기계 학습 알고리즘을 이용하여 지능형 데이터 처리가 끝났다. 데이터 마이닝은 CRUD (생성, 읽기, 업데이트 및 삭제)되지 않습니다. 우리는 몇 가지 데이터 마이닝 방법이 있습니다. 이로써 방법 및 일부 응용 프로그램. 분류 - 스팸으로 이메일을 분류 사기 등의 거래를 분류. 협회 - YouTube는 우리에게 우리의 역사를 기반으로 새로운 동영상을 제안합니다. 아마존은 체크 아웃하는 동안 우리에게 더 많은 항목을 제안합니다. 클러스터링 - 이러한 경제 뉴스 및 일반 그룹을 찾기 위해 의견 등 비정형 데이터의 분석. 프로세스 마이닝 - 비효율적 인 운영을 찾기 위해 전화 사업자의 로그를 검사합니다. 텍스트 마이닝 - 광산 뉴스 나 패턴 인식 기술 분석. 알고리즘 트레이딩은 거래 알고리즘의 자동 실행이다. 우리의 경우에는, 거래 알고리즘 마이닝에서 온다. 자동화 된 거래는 프로그래밍 언어의 어떤 왕에 의해 이루어집니다. 속도와 견고성 여기에 주요 사항은 다음과 같습니다 인간의 상인은 그 속성에 관한 컴퓨터 프로그램을 이길 수 없습니다. 그것은 HFT (고주파 거래) 및 (C)를 낮은 수준의 프로그래밍이나 장기 거래 및 (Java와 같은) 높은 수준의 프로그래밍을 할 수 있습니다. 알고리즘 트레이딩에 데이터 마이닝을 혼합 데이터 마이닝과 혼합 알고리즘 트레이딩은 중요하다. 가장 중요한 것은 데이터이다. 간단한 원리는 데이터가 충분하지 않은 경우, 당신의 모델이 충분하지 않습니다 (GIGO)를 말한다. 그것은 모든 모델을 만들기를 구현하고 (언제나처럼)을 테스트에 관한 것입니다. 현재이 흐름은 주로 설명서입니다. 데이터 마이닝 소프트웨어는 데이터 마이닝의 분야에서 많은 오픈 소스 소프트웨어 옵션이 있습니다. WEKA는 데이터 마이닝 프레임 워크는 와이 카토 해밀턴, 뉴질랜드의 대학에서 유래한다. WEKA는 자바로 작성된과 좋은 API를 가지고있다. 또한 당신은 잘 알려진 기계 학습 알고리즘의 대부분의 구현을 가지고있다. 좋은 도구의 혼합은 매우 중요합니다. 너무 많은 가능한 거래 모델이 있습니다. 동전을 던지는 것은 바보 같은 거래 시스템이지만 무역 시스템이야. 우리는 금을 찾기 위해 데이터 마이닝이 필요합니다. 좋은 도구는 광산과 너무 행운을 쉽게 얻을 수 있습니다. 당신이 과학 FX 거래에 대한 자세한 정보를 찾고 있다면 당신의 다음 단계는 데이터 마이닝 도구와 기록 데이터를 탐구한다. 자세한 내용은 algonell 방문하십시오. 당신은 트위터에 우리를 찾을 수 있습니다. 페이스 북. 구글. LinkedIn에 워드 프레스. 데이터 마이닝 및 거래 데이터 마이닝은 금융 시장에서 더 인기가 접근되고 강력한 도구입니다. 데이터 마이닝은 컴퓨터 과학의 하위 집합입니다. 그것은 통계, 컴퓨터 과학, 기계 학습, 인공 지능의 하위 범주의 가지를 조인 및 시스템 데이터베이스. 또한 대용량 데이터 세트에 정보를 발견하는 과정이다. 데이터 마이닝의 목적은 이해와 사용 가능한 정보로 데이터 세트를 변환하는 것이다. 데이터 마이닝 이상 검출, 연관 규칙 학습, 클러스터링, 요약, 분류 및 회귀 내 6 서브 클래스가 있습니다. 데이터 마이닝은 거래의 세계 내에서 무역에 사용되는 방법, 데이터 마이닝 기술은 실행 가능한 정보를 검색하기 위해 사용하는 방법에는 여러 가지가있다. 각 데이터 마이닝 기술은 특정 응용 프로그램에 대해 서로 다른 기술이 더 적합, 본질적인 한계와 가정이 있습니다. 무역 세계에서 데이터 마이닝의 일반적인 응용 프로그램 중 일부는 내부자 거래와 사기, 포트폴리오 관리를 검출하고, 거래 전략을 만들 수 있습니다. 내부자 거래 및 데이터 마이닝 SEC는 폼 (4) 다음 저장하고에 접근한다 구입하거나 회사의 주식을 판매하는 모든 이사, 임원 또는 회사의 주식의 10의 소유자, 양식 4.를 제출해야합니다 EDGAR 데이터베이스. 역사적 양식 4에 제출 한 데이터는 트랜잭션의 수백만 광산에 대한 익은입니다 거대한 데이터 세트를 제공, 기업의 수만 및 소유자의 수십만. 소유자에 의해 대부분의 거래는 불법 없습니다. 예를 들어, 소유자는 현재의 경제 상황이나 유동성 목적으로 적응하기 위해 그 / 그녀의 포트폴리오를 조정할 수 있습니다. 거래는 공개되지 않은 정보를 포함 할 때 내부자 거래는 불법으로 간주됩니다. 따라서 데이터 마이닝의 목적은, 이 경우, 소유자가 자신의 주 구매 또는 판매하기 전에 비공개 정보를 내포 한 요철 거래에서 일상 법적 거래를 구별하는 것이다. 할 설정 데이터 마이닝 응용 프로그램의 예는이 증권 관측, 뉴스, 분석 및 규정 (SONAR) 시스템이다. SONAR는 추가 조사를 위해 불규칙한 거래를 태그. 이 애널리스트는 추가 조사를위한 경고의 수백 온, 집계 프로세스, 수십 뉴스와 SEC 서류 매일 수천을 분석합니다. SONAR는 일반적인 패턴에서 특이점을 찾아 자연 언어 처리 (NLP) 텍스트 마이닝, 통계 회귀 분석, 규칙 기반 추론, 불확실성과 퍼지 매칭을 사용합니다. 다른 흥미로운 연구 Kirkos 등을 포함한다. (2007), 허위 재무 제표를 발행 한 기업을 분류하는 분류 기법, 의사 결정 나무, 베이지안 네트워크와 신경망을 사용하는 사람들. Donoho (2004) 내부 옵션 거래를 검출하기에 유망한 데이터 마이닝 기법을 활용 결과 (의사 결정 나무, 로지스틱 회귀 분석 및 신경 네트워크)를 발견했다. 다른 흥미로운 발견은 쳉 또한 주식을 구입하려는 소유자가 단지 자신의 구매 전에 비정상적으로 부정적인 뉴스를 해제하는 경향이 발견 소호 (2006)를 포함한다. Brockmen 등. (2010) 소유자는 스톡 옵션 운동 전에 비정상적으로 긍정적 인 뉴스를 발표 할 예정 것으로 나타났습니다. Lakonishok 및 (2001) 리 의해 수행 연구의 흥미로운 부분은 시장이 자신의 회사의 주식을 사고 파는 소유자의 신호에 underreact하는 경향이 있음을 발견했다. 데이터 마이닝은 우리가 소유자와 그들이 어떻게 자신의 회사의 주식을 거래에서 일관된 패턴을 발견 할 수 있습니다. 액세스 및 자신이 자신의 거래에 당신에게 정보 이점을 줄 수있는이 정보를 분석. 당신이 잡고 얼마나 당신의 목표는 목표 수익에 대한 위험을 최소화하는 것입니다 포트폴리오를 만들 수 있습니다 동안 각 개별 자산 및 전체 각 자산 클래스에 할당 할 수있는 유가 증권 결정합니까 포트폴리오 관리 방법, 그것이야 종종 매우 어려운 작업, 자산 크기와 수의 증가, 특히. 자본 자산 가격 결정 모형 (CAPM) 및 광고용 가격 이론 (APT)는 위험 관리와 포트폴리오 최적화 일반적인 도구입니다. APT는 신경망 앞으로 각 위험 요인을 분류하면서 가격을 결정하는 데 사용되도록 신경망 APT 통합되었다. 다른 데이터 마이닝 기술은 포트폴리오를 관리하는 다양한 작업을 적용 할 수있다. 예를 들어, 유전자 알고리즘은 각 자산 및 각 자산에 자금을 할당하는 유전자 알고리즘의 수익률을 예측, 신경 네트워크 자산을 선택하는 데 사용할 수 있습니다. 개별 주식을 예측하는 데이 트레이딩 및 데이터 마이닝 가장 일반적인 방법은 주당 순이익, P / E 및 PEG 비율, 매출액, 부채, 시장 점유율, 시가 총액 등의 기본적인 요소에 걸릴 것입니다. 볼륨 등 회귀, 신경망, 의사 결정 나무, 또는 지원 벡터 기계의 여러 유형의 기록 데이터의 큰 집합에 이러한 요소를 분석하고 내일의 주가의 방향을 분류합니다. 성능은 일반적으로 새로운 데이터에 대한 모델의 정확도에 의해 측정된다. 이것은 일반적으로 블랙 박스 접근 방식이라한다. 보다 투명한 데이터 마이닝 기술은 연관 규칙 학습이라고합니다. 연관 규칙 학습과 함께, 우리는 같은 요인과 재고를 분석하지만, 알고리즘은 우리를 대신하여 행동하는 것이 아니라, 우리는 알고리즘이 폭로 내용에 따라 우리 자신의 규칙을 만들 수 있습니다. 이점은 우리가 정보는 하루의 끝에서, 우리의 데이터 내에서 발견 된 정확히 알고 두 가지, 우리는 사람의 구매 및 재고를 판매하고 있습니다. 둘은 매우 중요하다. 당신이 그것을 검증 할 수 있도록 정보를 우리의 데이터 내에서 발견 된 정확히 아는 것이 중요합니다. 규칙이 t 당신에게 이해 아무튼 경우, 모델은 아마 잘못하고 당신이 그것을 조정할 필요가있다. 가짜 상관 관계와 패턴과 연관 규칙 학습을 발견 할 수 있습니다 데이터 마이닝은 우리가 그것을 방지 할 수 있습니다. 보고 발견 된 어떤 정보를 이해하기 위해서는, 당신은 좋은 시각화 도구가 필요합니다. 우리가 TRAIDE를 구축하는 이유입니다. 당신은 당신이 분석, 특정 자산의 패턴과 내용은 광산, 후 대화 형 대시 보드에 그 패턴을 시각화 할 요소를 선택할 수 있습니다. 그런 다음 조정할 실시간으로 데이터를 통해 그들을 테스트, 규칙을 최적화 할 수 있습니다. 데이터 마이닝은 금융 시장에서 많이 사용이 있습니다. 학계에서 연구하고 탐구하고 자신의 시스템에 적용 할 실제 애플리케이션의 증가 금액의 과다가있다. 당신이 (. 예를 들어, 인덱스, FX, 상품, 금리를) 다른 계량 데이터의 무리가있는 경우 데이터에 어떤 관계가 있는지 확인하기 위해 수식을 찾기 위해 시도 할 수 있습니다 - 예를 들어, 이 발견 된 패턴을 예측합니다. 수식 f를 (을 검색 할 수 있습니다 의미에서 다른 방법) 등의 소정의 양식을 특정 지표가 될 때 길거나 짧은 가서 발견 무역 전략을 나타내는 있는가 (또는 : 내가 여기 해달라고하는 것은 조금 다르다 파생 조합) 아이디어는 식 자체가 지표 / 트레이딩 전략의 N 차원 공간에 거주하고 가장 잘 할 수있는 생존하려고 할 것입니다. 이 인공 주식 시장을 시뮬레이션 멀티 에이전트 시스템을위한 표준 절차해야합니다. 아아, 난 그냥 할 수있는 간단한 방법을 찾을 수 없습니다입니다. 예, 각 신호의 구현을 사용하여 SAS는 당신을위한 요소 모델을 생성하기 위해 같은 다음 통계 패키지를 사용 9시 44분에서 3월 1일 11 물었다. 이 계수 수학 공식을 생성하고, 신호 (변수), 심지어 당신이 신속하게 자신이이 방법을 선택하여 바이어스를 스누핑 데이터에 노출 찾을 그러나 효능 (R 2)를 알려줍니다. 다음은이 논문에서 설명 된 결과와 유사 : 사람들이 역사적인 통계 효능을 통해 자신의 전략에 대한 경제 논리를 강조하는 이유 eco. sdu. edu. cn/jrtzx/uploadfile/pdf/empiricalfinance/10.pdf 데이터-스누핑 바이어스, 인 자주 향후 복제 할 수 없습니다. 20시 6분에서 3월 1일 (11)에 대한 답변 감사합니다. 당신은 무역 규칙 (예를 들어, 이동 평균) 및 수학 인코딩 예를 전해 주 시겠어요. MA (INT의 numdaysavg)을 반환 가격의 시계열과 함께, 시간이 지남에 따라 시계열을이 함수의 결과를 사용 12시 27분에서 vonjd 3월 2일 (11)는이 같은 기능을합니다. (이것은 어쩌면 나는 완전히 질문을 오해 13시 46분에서 3월 2일 11 glyphard 같으면, 하지만 지정된 / 알려진 모델에 맞게 반대로 당신이 모델 구조를 찾기 위해 찾고있는 나에게 보인다. 당신의 맥락에서 모델 사양합니다 ( 무역 규칙) 알 수없는 그런 경우, 아마 유전 프로그래밍인가하면 내가 맞다 :. 당신은 간단히 말해서 필요가 무엇인가, 그것이 모델 구조 (프로그램)을 찾기위한 진화 적 접근 방식을 적용 GA의 하위 클래스입니다 대부분 맞습니다. 진화 개선 대대로. 내 생각 엔이 경우 언어 사전 구조 (변수)의 집합 당신이 당신의 처분에, 그리고 언어 문법 Btw는. 규칙이되는 것입니다. 좋은 질문에 3월 8일 (11)에 대한 답변 15시 36분 user40 :이 내 원래의 기준이었다 사실에 감사합니다, 당신은 내게 몇 가지 아이디어 또는 19시 48분에서 GP vonjd의 알파벳 3월 8일 (11) 내에서 거래 규칙을 인코딩하는 방법 참조를 줄 수 다음은 75 거래의 예입니다. R 코딩 규칙 : (다음 스크립트 데이터의 임의의 시리즈를 생성하고 말하는 소위 75 규칙 (N-1) 가격 잠 가격 가격을 따릅니다 하나 이것은 저자가 규칙을 설명하는 방법 인 랜덤 워크 (random walk)를 이길 수 75 중간 N-1) 가격.




No comments:

Post a Comment