pythondataframe去中心化
① dataframe 如何按行處理數據
剛開始的時候,我也是很笨的遍歷df來著... 幾千個數據量到無所謂,一旦超過幾萬個就可以去衛生間拉個屎回來了... 我的廢話太多了。。。。。
對於你這個問題,我不是很明白,如果能給我一個處理前rst樣子和你預期的處理後rst的樣子就好了。只要包含幾行樣本就可以了~(要截圖哈~)
② python3 dataframe怎麼去重復數據
import pandas as pd
data = pd.read_csv('d:/ddd.txt')
print(data.drop_plicates())
③ python 怎麼去data frame數據空格
1
2
3
4
5
6
7
8
9
10
11
12
13
14
In [3]: import pandas as pd
In [4]: a = pd.Series([1,2,3])
In [5]: b = pd.Series([2,3,4])
In [6]: c = pd.DataFrame([a,b])
In [7]: c
Out[7]:
0 1 2
0 1 2 3
1 2 3 4
不過pandas直接用列表生成dataframe只能按行生成,如果是字典可以按列生成,比如:
1
2
3
4
5
6
7
8
In [8]: c = pd.DataFrame({'a':a,'b':b})
In [9]: c
Out[9]:
a b
0 1 2
1 2 3
2 3 4
④ DataFrame中怎樣去除數據中的$符號
可以使用pd提供的apply函數來實現.
#因為這個是價格列,後期肯定會涉及到計算的,不然也需要去掉$符號了,所以最後把價格列的數據類型改成浮點值
#apply里的是一個匿名函數,用來處理價格列里的每個值.
df.item_price=df.item_price.apply(lambdax:x[1:]).astype('float')
#當然,也可以把下面的函數傳到apply裡面也是一樣的,功能都是一樣的,只不過省了個寫函數的過程
defsetNumberPrice(x):
returnx[1:]
⑤ python dataframe提取index合並至列
因為你引用g.col[1:]的時候index沒有變化,1,2,3,4對應的還是1,3,5,7。只是少了row 0 而已這樣你用g.col[1:] - g.col[:]的時候,相減的並不是你想像的, pandas會找相同的index做運算。所以1,2,3,4位置對應的值都一長肌拜可之玖瓣雪抱磨樣,減完就是0。row 0位置沒有可以減的,就是NaN。所以最後你得到Nan, 0,0,0,0. 使用shift可以把value沿著index往下Shift。
⑥ 如何用python去6個dataframe,兩兩交集,三三交集
你這個相當於只是6個數字枚舉兩兩或者三三,
兩兩這個用for循環就行,第一層用i,第二層j從i+1開始
三三第三層k從j+1開始
然後再做你需要的事情
⑦ python已知某個元素,怎麼得到該元素在dataframe中的位置
雖然時隔快四年的提問了,但還是不得不給出最好的答案,那個回答說「for循環」的答案簡直是牛頭不對馬嘴啊,
我的答案:
pandas.dataframe中根據條件獲取元素所在的位置(索引)
df=pd.DataFrame({'BoolCol':[1,2,3,3,4],'attr':[22,33,22,44,66]},
index=[10,20,30,40,50])
print(df)
a=df[(df.BoolCol==3)&(df.attr==22)].index.tolist()
print(a)
⑧ Python中b=a.apply(lambda x: a.columns[x][0],axis=1)是什麼意思呢,a是一個DataFrame,求詳解
完全看不懂,試了一下也沒跑通
axis=1意味著把行 當做變數傳進去,也就是x
把行內容當做列索引去取,沒有辦法取到吧
⑨ Python:怎麼將"列表嵌套字典"轉換成理想的DataFrame