stata去掉重复值的命令

stata去掉重复值的命令

问:如何用stata删除变量中的重复值,但保留重复值中的一个观测
  1. 答:duplicates drop varlist, force
    duplicates drop 是命令, varlist是你要按照哪些变量 ..
  2. 答:duplicates examples 变量a
    duplicates drop 变量a,force
    执行命令即可去除重复数据
问:如何正确的利用STATA删除重复数据
  1. 答:如何正确的利用STATA删除重复数据
    删除重复数据 duplicates drop [if] [in] duplicates drop varlist [if] [in] , force
问:如何在stata中剔除部分数据
  1. 答:剔除变量***
    drop ***
    当观测值符合某条件时,剔除观测值:
    drop if ***
  2. 答:短面板处理 面板数据是指既有截面数据又有时间序列的数据,因此其存在截面数据没有的优势,在用stata进行面板数据的估计时,一般选择xtreg命令进行拟合
    操作方法
    01
    打开stata,在命令行输入ssc install winsor2, replace,自动安装 winsor2

    02
    准备数据(注意输入格式)

    03
    导入数据File-Inport

    04
    输入命令winsor2 变量名 变量名, replace cuts(1 99),此条命令是先找到各个变量的1%,99%所对应的分位数,比如对于变量ac1,其分位数分别为a、b,那么将数据中小于a的数替换成a,将大于b的数替换成b,原始数据直接变为新数据,这样就是缩尾,使数据平滑(口径为1%)。若输入命令winsor2 变量名 变量名, replace cuts(1 99) trim,则不替换,将小于a和大于b的直接删除

    05
    最后一张图显示的是命令winsor2 ac1 ac2, replace cuts(1 99) trim命令的执行结果,大家看到数据表中的“.”,即是删除完异常值后的结果,批量处理后可以File-Export将数据导出,在Excel上排序后即可将其删除(或在STATA上用其他命令也可)
  3. 答:剔除数据的依据或者判断标准是哪些呢
stata去掉重复值的命令
下载Doc文档

猜你喜欢