以下的文章主要描述的是MySQL数据库下limit与join的实际优化方案,我们大家都知道其在实际中的应用比例还是占为多数的,如果你对这一技术,心存好奇的话,以下的文章将会揭开它的神秘面纱。
PHP中分页肯定会使用到MySQL的limit,大部分对类似”select * from title where uid =** order by id desc limit m,n”很熟悉,也不是全部都能看出里面有什么不对,可是当是在大数据量下操作呢,比如百万类似”select * from title where uid =177 order by id desc limit 1234567,20″就会发现sql执行的时间明显变得很长,为什么呢
先从MySQL数据库的limit原理说起,使用limit m,n是时候,MySQL先扫描(m+n)条记录,然后从m行开始取n行.比如上面的例子就是先扫描1234587条数据,这样的话sql能快吗 这就要 求我们尽可能的减少m的值,甚至没有m直接limit n这样是sql.
看个例子:
mysql> select id,substr(mobile from 1 for 7),time,cpid,linkid from cp_mo100227 where cpid=769 limit 888888,10; +———-+—————————–+———————+——+———————-+ | id | substr(mobile from 1 for 7) | time | cpid | linkid | +———-+—————————–+———————+——+———————-+ | 11535090 | 1353554 | 2010-02-24 21:07:48 | 769 | 21064905903309587933 | | 11535091 | 1353750 | 2010-02-24 21:07:48 | 769 | 21064912943389480033 | | 11535093 | 1353394 | 2010-02-24 21:07:48 | 769 | 21064912945389480075 | | 11535098 | 1343073 | 2010-02-24 21:07:50 | 769 | 21064905865309587977 | | 11535100 | 1369270 | 2010-02-24 21:07:51 | 769 | 21064926770369210194 | | 11535103 | 1355683 | 2010-02-24 21:07:51 | 769 | 21064912944389480113 | | 11535104 | 1368959 | 2010-02-24 21:07:51 | 769 | 21064902508384448468 | | 11535105 | 1365243 | 2010-02-24 21:07:51 | 769 | 21064905907309403124 | | 11535106 | 1362145 | 2010-02-24 21:07:52 | 769 | 21065002511384448497 | | 11535107 | 1369228 | 2010-02-24 21:07:52 | 769 | 21064902514384448437 | +———-+—————————–+———————+——+———————-+ 10 rows in set (3.84 sec) mysql> select id,substr(mobile from 1 for 7),time,cpid,linkid from cp_mo100227 where cpid=769 and id>=11535090 limit 10; +———-+—————————–+———————+——+———————-+ | id | substr(mobile from 1 for 7) | time | cpid | linkid | +———-+—————————–+———————+——+———————-+ | 11535090 | 1353554 | 2010-02-24 21:07:48 | 769 | 21064905903309587933 | | 11535091 | 1353750 | 2010-02-24 21:07:48 | 769 | 21064912943389480033 | | 11535093 | 1353394 | 2010-02-24 21:07:48 | 769 | 21064912945389480075 | | 11535098 | 1343073 | 2010-02-24 21:07:50 | 769 | 21064905865309587977 | | 11535100 | 1369270 | 2010-02-24 21:07:51 | 769 | 21064926770369210194 | | 11535103 | 1355683 | 2010-02-24 21:07:51 | 769 | 21064912944389480113 | | 11535104 | 1368959 | 2010-02-24 21:07:51 | 769 | 21064902508384448468 | | 11535105 | 1365243 | 2010-02-24 21:07:51 | 769 | 21064905907309403124 | | 11535106 | 1362145 | 2010-02-24 21:07:52 | 769 | 21065002511384448497 | | 11535107 | 1369228 | 2010-02-24 21:07:52 | 769 | 21064902514384448437 | +———-+—————————–+———————+——+———————-+ 10 rows in set (0.00 sec) mysql> select id,substr(mobile from 1 for 7),time,cpid,linkid from cp_mo100227 where cpid=769 and time>=’2010-02-24 21:07:48′ limit 10; +———-+—————————–+———————+——+———————-+ | id | substr(mobile from 1 for 7) | time | cpid | linkid | +———-+—————————–+———————+——+———————-+ | 11535090 | 1353554 | 2010-02-24 21:07:48 | 769 | 21064905903309587933 | | 11535091 | 1353750 | 2010-02-24 21:07:48 | 769 | 21064912943389480033 | | 11535093 | 1353394 | 2010-02-24 21:07:48 | 769 | 21064912945389480075 | | 11535098 | 1343073 | 2010-02-24 21:07:50 | 769 | 21064905865309587977 | | 11535100 | 1369270 | 2010-02-24 21:07:51 | 769 | 21064926770369210194 | | 11535103 | 1355683 | 2010-02-24 21:07:51 | 769 | 21064912944389480113 | | 11535104 | 1368959 | 2010-02-24 21:07:51 | 769 | 21064902508384448468 | | 11535105 | 1365243 | 2010-02-24 21:07:51 | 769 | 21064905907309403124 | | 11535106 | 1362145 | 2010-02-24 21:07:52 | 769 | 21065002511384448497 | | 11535107 | 1369228 | 2010-02-24 21:07:52 | 769 | 21064902514384448437 | +———-+—————————–+———————+——+———————-+ 10 rows in set (0.01 sec)
例中数据表id是主键,time也建了索引,表中总数据约为240w行,其中cpid为769的数据量大约为90w条.这里面的id和时间可能会是不连续的.故不能直接得获取id>m这样操作
所以可以显示 “1,2,3,4,5,末页” 或是 “首页,<<100,101,102,103 >>末页”这样,这样可以极大的减少m值!
MySQL里面的join顺便说一句就是,通常有点讲究的是用小表去驱动大表,而由于MySQL join实现的原理就是做循环比如left join就是对左边的数据进行循环去驱动右边的表,比如左边是可能会有m条记录匹配,右边有n条记录那么就是做m次循环,每次扫描n行数据,总扫面行数是 m*n行数据.左边返回的结果集的大小就决定了循环的次数,故单纯的用小表去驱动大表不一定的正确的。
小表的结果集可能也大于大表的结果集,所以写 join的时候尽可能的先估计两张表的可能结果集,用小结果集去驱动大结果集.值得注意的是在使用left/right join的时候,从表的条件应写在on之后,主表应写在where之后.否则MySQL数据库会当作普通的连表查询!
很多使用Windows 7系统的朋友都想小编反应,假如暂停使用电脑,鼠标会出现停顿现象,这是怎么回事呢 该怎么解决呢 下面就和小编一起去看下Windows 7 usb鼠标停顿的解决方法吧。 由于Windows 7系统中有一项USB选择性暂停造成的。这项设置主要为了节电,当他检测到用户没有对系统进行...
在Windows 7系统的默认设置中,当Windows 7系统处于休眠状态时,会同时断网的。如此一来,无论你正在使用迅雷还是快车等下载工具,同样可以在休眠状态下继续完成下载,最大限度做到从身边的小事开始支持环保。下面我们就详细介绍操作步骤,帮助Windows 7系统用户实现这一节能目标。 首先需要...
有些使用本本的朋友可能会发现,右下角通知栏区域会无法显示电源按钮,导致在插上电源或者是使用电池的时候都无法进行区分。造成这种情况大部分都是因为使用了第三方修改过的系统版本或者对于系统优化过度,所以今天就来解决这个问题。 第一步:在开始菜单的搜索窗口输入“gpedit.msc”,进入组策略编辑器,依...
出现该问题的原因是由于使用第三方优化软件消除快捷方式的小箭头引起的。 1、在开始搜索框中键入“regedit”,按回车键打开注册表编辑器。 2、依次定位到以下分支:HKEY_CLASSES_ROOTlnkfile。 3、在lnkfile项上鼠标右键单击“新建”——“字符串值”。...
一些用户的Windows 7系统开机后出现黑屏,代码为 Windows无法启动: WindowsSystem32ConfigSystem”。这个问题该如何修复呢?现在小编就给大家分析一下吧。 其实这个代码的意思是引导文件丢失了,引导文件(NTLDR)一般存放于C盘根目录下,是一个具有隐藏和只读属性...
最近一些Windows 7用户反馈说,自己在截屏的时候出现黑屏,导致自己截的图黑呼呼一片。这个问题该怎么解决?今天小编就为大家提供一个解决的方法。 步骤 1 在windows xp时代,很多用户都曾被视频截图后的“全黑图片”困扰。对此,在解决本地播放时出现的截图变黑问题,一般有两个方法可以用来解...