建站软件 优化软件 编程软件 网页辅助 站群程序 网站程序 图像处理 资源教程 字体下载 推荐软件


您的位置:首页 > MYSQL学习 > mysql获取随机数据优化分析总结

mysql获取随机数据优化分析总结

时间:2015-06-30 17:03:12  来源:免费模板网 作者:风雪 阅读次数 tags随机

在一些信息网站有时候有这样的栏目。阅读随机内容。那么这个功能怎么实现呢。或者想执行效率更高要怎么写。请看下文
在mysql中获取随机数据方法很简单只要使用order by rand()即可了,但是如果你是百万级数据量,使用order by rand()获取随机数据你会等死去,下面我来介绍具体的解决办法.

1.order by rand()

数据多了极慢,随机性非常好,适合非常小数据量的情况,代码如下:

  1. SELECT * FROM table_name AS r1 JOIN (SELECT (ROUND(RAND() * (SELECT ABS(MAX(id)-MIN(id)-$limit) FROM table_name))+(SELECT MIN(id) from table_name)) AS id) AS r2 WHERE r1.id >= r2.id ORDER BY r1.id ASC LIMIT $limit; 

速度非常快,但是得到的数据是id连续的,没办法解决.

子查询产生一个随机数,rand()是0到1的随机数,可以等于0到1,MAX(id)-MIN(id)还要减去$limit以免结果数量不够$limit条,因为主表id可能不连续,所以r1.id要>=r2.id.

还要注意的是有时候最小id不是从1开始的,可能从一个很大的数开始,所以必须加上M(id)的值.

手册相关内容:若要在i ≤ R ≤ j 这个范围得到一个随机整数R,需要用到表达式 FLOOR(i + RAND() * (j – i + 1)).

例如,若要在7 到 12 的范围(包括7和12)内得到一个随机整数,可使用以下语句:

  1. SELECT FLOOR(7 + (RAND() * 6));  
  2. select * from test where rand()>0.0005 limit 10; 

0.0005是一个计算出的比例直接关系到随机的质量,比如数据表10000条数据,需要随机取300条,那么0.0005就需要改成(300/10000=0.03).

这种方法不能保证每次能取到多少,需要取多次,2和3速度一样的快,主要区别是2总能返回limit条数据,3就没准了,符合正太分布,2是连续数据,3是随机行.

本文地址:https://www.freemoban.com/mysql/2015/0630/2238.html

猜你喜欢
栏目推荐
模板推荐

Copyright:www.freemoban.com 免费模板网 All Rights Reserved 网站备案:辽ICP备19014872号-2   辽公网安备 21010602000376号  辽公网安备:42900402000182号

免责声明:本站部分资源来自互联网收集,版权归原创者所有,如果侵犯了你的权益,我们会及时删除侵权内容,联系QQ:1615187561 谢谢合作!