手把手教你用python选基金_ZNDS问答

hovo

买基金是上班族用零钱进行投资的正确姿势。而自个用数据来选基金比听别人推荐买什么基金要好上一百倍。
步骤如下：
1.获取网上的基金的排名信息，使用四四三三法则筛选出排名靠前的基金。2.获取网上的基金的基本信息和夏普比率，筛选出夏普比率高的基金。

接下来就一步一步介绍方法。
准备工作:
使用工具是Python3。不过一般会使用conda3的安装包进行安装。一些库都会安装进来。

获取网上的基金的排名信息，使用四四三三法则筛选出排名靠前的基金。

天天基金网上有基金的排名，可以用Python进行抓取和筛选。四四三三法则即选择出3年/2年/1年的排名在前四分之一，6个月/3个月的排名在前三分之一的基金。
下面就是抓取的URL。(只抓取混合基金）
http://fund.eastmoney.com/data/rankhandler.aspx?op=dy&dt=kf&ft=hh&rs=&gs=0&sc=qjzf&st=desc&sd=2019-05-06&ed=2020-05-05&es=1&qdii=&pi=1&pn=5&dx=1
URL中有几个需要理解的参数。sd 和 ed 是起始和结束日期。分别对应要考察的期间。pi 对应的是页数，pn 对应的是每页的记录数。
下面就是返回的内容。有点难懂？其实只需要datas后面的内容。这个例子里可以看到最近1年共有5053支基金。那么排名四分之一就是在25%*5053=1263支基金。
（返回数据已经按照从高到低进行了排序，抽取前n支基金即可。）

Python很容易处理这些信息。
上代码进行说明。
import pandas as pd
import urllib.request

url = &#39;http://fund.eastmoney.com/data/rankhandler.aspx?op=dy&dt=kf&ft=hh&rs=&gs=0&sc=qjzf&st=desc&sd=2019-05-06&ed=2020-05-05&es=1&qdii=&pi=1&pn=5&dx=1&#39;
r = urllib.request.urlopen(url, timeout=15)
content = r.read().decode(&#39;utf-8&#39;)
content2 = content[15:-1]

m = [&#39;datas&#39;, &#39;allRecords&#39;, &#39;pageIndex&#39;, &#39;pageNum&#39;, &#39;allPages&#39;, &#39;allNum&#39;, &#39;gpNum&#39;, &#39;hhNum&#39;, &#39;zqNum&#39;, &#39;zsNum&#39;,
   &#39;bbNum&#39;, &#39;qdiiNum&#39;, &#39;etfNum&#39;, &#39;lofNum&#39;, &#39;fofNum&#39;]

for c in m:
content2 = content2.replace(c, &#39;&#34;&#39; + c + &#39;&#34;&#39;)

d = {&#39;allRecords&#39;: 0, &#39;pageIndex&#39;: 0, &#39;pageNum&#39;: 0, &#39;allPages&#39;: 0, &#39;allNum&#39;: 0, &#39;gpNum&#39;: 0, &#39;hhNum&#39;: 0,
   &#39;zqNum&#39;: 0, &#39;zsNum&#39;: 0, &#39;bbNum&#39;: 0, &#39;qdiiNum&#39;: 0, &#39;etfNum&#39;: 0, &#39;lofNum&#39;: 0, &#39;fofNum&#39;: 0}
d = eval(content2)

num = int(d[&#39;allRecords&#39;])
df = pd.DataFrame.from_records(pd.Series(d[&#39;datas&#39;]).str.split(&#39;,&#39;).values)
df_fin = df[[0, 1, 2, 3]]
df_fin.columns = [&#39;code&#39;, &#39;name&#39;, &#39;name2&#39;, &#39;rose(1y)&#39;]
df_fin.set_index(&#39;code&#39;, inplace=True)
df_fin[&#39;rank(1y)&#39;] = df_fin.index + 1
df_fin[&#39;rank_r(1y)&#39;] = df_fin[&#39;rank(&#39;1y&#39;].astype(str) + &#39;/&#39; + str(num)这样就把数据抽出了。当然，只是部分。需要循环把数据补充完整。dataframe 内的数据是这样的。

2. 获取网上的基金的基本信息和夏普比率，筛选出夏普比率高的基金。
通过四四三三法则选择出排名靠前的基金共有171个。需要继续进行筛选。目标是从171支基金里选出20支基金。规则是资金规模超过1亿的高夏普比率的基金。
同样从天天基金网获取资金规模和获取夏普比率。URL如下。
http://fund.eastmoney.com/f10/006279.html
http://fund.eastmoney.com/f10/tsdata_006279.html
Python很容易处理。
url = &#39;http://fund.eastmoney.com/f10/006279.html&#39;
tables = pd.read_html(url)
df = tables[1]
df1 = df[[0, 1]]
df2 = df[[2, 3]]
df1.set_index(0, inplace=True)
df2.set_index(2, inplace=True)
df1 = df1.T
df2 = df2.T
df1[&#39;code&#39;] = &#39;006279&#39;
df2[&#39;code&#39;] = &#39;006279&#39;
df1.set_index(&#39;code&#39;, inplace=True)
df2.set_index(&#39;code&#39;, inplace=True)
df_fin2 = pd.concat([df1, df2], axis=1)dataframe 内的数据是这样的。

url2 = &#39;http://fund.eastmoney.com/f10/tsdata_006279.html&#39;
tables2 = pd.read_html(url2)
df = tables2[1]
df[&#39;code&#39;] = &#39;006279&#39;
df.set_index(&#39;code&#39;, inplace=True)
df.drop(u&#39;基金风险指标&#39;, axis=&#39;columns&#39;, inplace=True)
df_fin3 = df[1:]
df_fin3.columns = u&#39;夏普比率(&#39; + df_fin3.columns + &#39;)&#39;dataframe 内的数据是这样的。

接下来把这些dataframe粘在一起就可以了。
df_fin4 = df_fin2.combine_first(df_fin3)
df_fin4 = df_fin.combine_first(df_fin4)把3年/2年/1年/6个月/3个月的排名乘上权重(0.3/0.25/0.2/0.15/0.1)计算综合排名并排序。取前50条数据。
df_fin4[&#39;rank&#39;] = df_fin4[&#39;rank_r2(3y)&#39;] * 0.3 + df_fin4[&#39;rank_r2(2y)&#39;] * 0.25 + df_fin4[&#39;rank_r2(1y)&#39;] * 0.2 + df_fin4[&#39;rank_r2(6m)&#39;] * 0.15 + df_fin4[&#39;rank_r2(3m)&#39;] * 0.1
df_fin4.sort_values(by=&#39;rank&#39;, inplace=True)
df_fin5 = df_fin4[:50]再按照夏普比率进行排名，取前20条数据。
cols = [&#39;基金代码&#39;, &#39;基金简称&#39;, &#39;基金管理人&#39;, &#39;基金类型&#39;, &#39;基金经理人&#39;,
      &#39;rank_r(3y)&#39;, &#39;rank_r(2y)&#39;, &#39;rank_r(1y)&#39;, &#39;rank_r(6m)&#39;, &#39;rank_r(3m)&#39;,
      &#39;rose(3y)&#39;, &#39;rose(2y)&#39;, &#39;rose(1y)&#39;, &#39;rose(6m)&#39;, &#39;rose(3m)&#39;,
      &#39;夏普比率(近3年)&#39;, &#39;夏普比率(近2年)&#39;, &#39;夏普比率(近1年)&#39;, &#39;资产规模(亿)&#39;]
df_fin5.sort_values(by=[&#39;夏普比率(近3年)&#39;, &#39;夏普比率(近2年)&#39;, &#39;夏普比率(近1年)&#39;], ascending=False, inplace=True)
df_fin7 = df_fin6[:20][cols]最后导出到CSV里看一下。
df_fin7.to_csv(&#39;out7.csv&#39;, encoding=&#39;gbk&#39;, index=False)

如何样？自个通过数据选择出来的基金是不是买起来更安心？

太厉害了，这就是我学习py的动力[捂脸]

有没有源代码提供看一下
[欢呼]

第一个url打开有点问题，是天天基金网会员专属吗？var rankData ={ErrCode:-999,Data:"无访问权限"}

我也是

需要加header

		自动登录	找回密码
密码			立即注册

手把手教你用python选基金

相关问题更多>

最新回答